https://www.facebook.com/818151428040982/

Tư duy ngược đời và tư duy phản phé, Hanoi (2026)

21/05/2026

Mình ngồi xem hết toàn bộ 2 tiếng rưỡi keynote Google IO 2026 tối qua.

Và phải nói thật — đây không phải một bản cập nhật phần mềm bình thường.

Đây là lúc Google chính thức tuyên bố: kỷ nguyên chatbot đã kết thúc, kỷ nguyên tác nhân AI tự hành động đã bắt đầu.

Nếu bạn đang dùng AI để viết email, dịch bài, trả lời câu hỏi... thì bạn đang dùng đúng 10% khả năng của nó.

Dưới đây là 7 thay đổi lớn nhất mà mình tin sẽ trực tiếp ảnh hưởng đến cách chúng ta làm việc và xây dựng hệ thống kinh doanh trong vài tháng tới.

1.Trợ lý AI cá nhân chạy 24/7 — kể cả khi bạn tắt máy
Google vừa ra mắt Gemini Spark.
Đây không phải chatbot.

Đây là một tác nhân AI chạy trên máy ảo chuyên dụng của Google Cloud.

Bạn chỉ cần nói bằng giọng — giao việc cho nó — rồi gập laptop đi chơi.

Hệ thống sẽ tự chạy trong nền. Tự chia nhỏ công việc thành từng nhiệm vụ. Tự xử lý từng cái một.

Trong demo live, người trình bày nói một hơi 3 nhiệm vụ khác nhau cùng lúc:

-Tìm tất cả cuộc họp với sếp rồi tô hồng để không bỏ lỡ
-Viết thư mời hàng xóm mới đến bữa tiệc khu phố
-Tạo danh sách việc cần làm cho con trước khi hết năm học, phân loại theo hạn chót

Spark nhận hết, chia ra thành các luồng riêng, xử lý trong nền. Người dùng cất điện thoại đi làm việc khác. Quay lại thấy tài liệu Google Docs hoàn chỉnh — có danh sách kiểm tra, mã màu, phân chia theo từng đứa con.

Mùa hè này Spark sẽ chạy trực tiếp trong trình duyệt Chrome — biến Chrome thành trình duyệt tác nhân AI. Cuối năm ra mắt Android Halo — trang chủ chuyên dụng cho tác nhân AI trên điện thoại.

2.Hệ điều hành chuyên dụng cho tác nhân AI — và demo xây hệ điều hành từ số 0
Anti-gravity 2.0 là ứng dụng máy tính độc lập hoàn toàn mới, được thiết kế chỉ để quản lý và điều phối hàng loạt tác nhân AI làm việc cùng nhau.

Triết lý thiết kế rất rõ ràng — ưu tiên tác nhân trước hết. Tập trung vào hội thoại tác nhân, tài liệu kết quả do tác nhân tạo ra, và khả năng điều phối nhiều tác nhân cùng lúc.

Các tính năng cốt lõi mới:

-Tác nhân con — để chia nhỏ công việc phức tạp
-Cơ chế bắt sự kiện — để tự động phản ứng khi có thay đổi
-Quản lý tác vụ bất đồng bộ — để nhiều việc chạy song song

Demo ấn tượng nhất: Họ dùng Anti-gravity + Gemini 3.5 Flash để yêu cầu tác nhân AI tự viết mã và xây dựng một hệ điều hành hoạt động hoàn chỉnh từ con số 0.

Sau đó chạy thử game Doom trên đó — và nó chạy được.

Có sẵn cho tất cả mọi người trên toàn cầu ngay hôm nay.

3.Công cụ tìm kiếm tự lập trình giao diện riêng cho câu hỏi của bạn
Thay vì trả về đường link xanh hoặc đoạn tóm tắt, Google Search giờ tích hợp khả năng tự động lập trình.

Khi bạn hỏi một câu phức tạp, hệ thống sẽ tự viết mã ngay lập tức — tạo ra bố cục động, bảng biểu tương tác, widget trực quan — thiết kế riêng hoàn toàn cho câu hỏi cụ thể của bạn, tại thời điểm đó.

Demo trực tiếp: Hỏi "Hố đen ảnh hưởng đến không-thời gian thế nào?" → nhận mô phỏng trực quan tương tác ngay trong kết quả tìm kiếm.

Hỏi tiếp "Cho xem hai hố đen quay quanh nhau tạo sóng hấp dẫn" → Search tự lập trình và tạo hình ảnh tương tác hoàn toàn mới theo thời gian thực.

Miễn phí cho tất cả mọi người. Triển khai mùa hè 2026.

4. Gemini 3.5 Flash — nhanh gấp 4 lần, thông minh ngang hàng các mô hình hàng đầu
Hai điểm quan trọng nhất:

So với Gemini 3.1 Pro: Flash vượt trội gần như toàn bộ các điểm chuẩn. Tiến bộ lớn về lập trình. Nhảy vọt đặc biệt ở GPQA — bộ đo lường các tác vụ có giá trị kinh tế thực tế.

Tốc độ sinh token đầu ra nhanh gấp 4 lần các mô hình tiên phong khác. Nằm ở một đẳng cấp hoàn toàn riêng biệt trên biểu đồ trí thông minh so với tốc độ.

Gemini 3.5 Pro đang dùng nội bộ, sẽ phát hành tháng tới.

5.Gemini Omni — tạo và chỉnh sửa video bằng hội thoại tự nhiên
Mô hình kết hợp trí thông minh Gemini với các công cụ tạo phương tiện tốt nhất — tạo video, ảnh, giả lập từ mọi đầu vào.

Điểm đặc biệt:

-Hiểu vật lý trực quan — mô phỏng chính xác động năng, trọng lực (các hệ thống trước không làm được)
-Chỉnh sửa video bằng ngôn ngữ hội thoại — lặp đi lặp lại, tự nhiên như nói chuyện
-Nhận video cá nhân rồi biến đổi phong cách, thêm nhân vật, đổi góc quay 360 độ — mà vẫn giữ nguyên hiệu suất diễn xuất gốc
Có sẵn cho người dùng trả phí trên ứng dụng Gemini ngay hôm nay.

6.Giỏ hàng thông minh toàn cầu — mua sắm xuyên mọi nền tảng
Universal Cart — giỏ hàng hoạt động xuyên cửa hàng, xuyên dịch vụ.

Thêm sản phẩm khi đang lướt Search, trò chuyện Gemini, xem YouTube, hay đọc Gmail. Giỏ hàng tự làm việc trong nền — tìm ưu đãi, theo dõi giảm giá, phân tích lịch sử giá, thông báo khi hàng có lại.

Triển khai tại Mỹ mùa hè — Search và Gemini App trước, YouTube và Gmail theo sau.

7-Kính âm thanh AI đầu tiên — trợ lý AI nói thầm vào tai cả ngày
Ra mắt mùa thu 2026.

Thiết kế cho phép Gemini hỗ trợ cả ngày — thông tin được nói trực tiếp vào tai riêng tư.

Rảnh tay hoàn toàn: nghe nhạc, chụp ảnh, gọi điện, truy cập ứng dụng — không cần rút điện thoại.

Demo live ấn tượng: Đeo kính → hỏi đường → Gemini nhớ ngữ cảnh tuần trước → chỉ đường + thêm điểm dừng mua cà phê → tự mở DoorDash trên điện thoại trong túi quần → đặt hàng → chờ xác nhận → thêm tip 20%.

Sau đó kiểm tra tin nhắn → tự thêm bữa tối gia đình vào lịch.

Kết nối được cả đồng hồ thông minh. Tương thích Android và iOS.

Còn nhiều cập nhật quan trọng khác:
Google Pix (công cụ thiết kế ảnh trong Workspace), Google Flow Music (biến bản thu piano thành demo bài hát hoàn chỉnh), Docs Live (soạn tài liệu bằng giọng nói), Ask YouTube (hỏi đáp AI trên YouTube), Synth ID mở rộng sang Chrome và Search để xác thực ảnh AI, và cả Gemini for Science giúp tăng tốc nghiên cứu khoa học.

Nói nhẹ một chút...

Sundar Pichai kết thúc keynote bằng câu: "Khi nhìn lại thời điểm này, tôi nghĩ chúng ta sẽ nhận ra rằng chúng ta đang đứng ở chân núi của Điểm kỳ dị."

Nghe có vẻ to tát. Nhưng nhìn lại những gì vừa được trình diễn — tác nhân AI chạy 24/7 không cần con người giám sát, hệ thống tự lập trình giao diện theo câu hỏi, kính thông minh đặt cà phê bằng giọng nói — thì câu nói đó không hề phóng đại.

Cánh cửa công nghệ này đang mở ra rất nhanh. Người đi nhanh nhất không phải người giỏi công nghệ nhất — mà là người biết biến công nghệ thành hệ thống làm việc thay cho mình.

Nếu bạn muốn xây dựng hệ thống nội dung và quy trình kinh doanh tự động bằng AI để đón đầu xu hướng này...

Comment bên dưới chữ: "AI" Mình sẽ gửi tặng bạn tài liệu hướng dẫn từng bước thiết lập cỗ máy nội dung AI hoàn toàn miễn phí 👇

18/05/2026

18/05/2026

Sau 36 tiếng dày công nghiên cứu và thảo luận với trợ lý Jarvis, tôi xin phép công bố chức năng quan trọng nhất của TruyenDrive - xem ảnh ⚡️ trực tiếp trên Google Drive mà không bị kiểm duyệt, kết tinh từ vẻ đẹp của toán học và công nghệ.

Đây là một pain point của TruyenDrive v1, khi mà một thư mục khi bật public sẽ bị Google quét nội dung ảnh. Để né cái gậy này của Google, uploader thường nén các ảnh lại thành 1 file zip, cẩn thận hơn thì thêm password. Nhưng khi đó người đọc muốn xem lại phải tải về, đi ngược với tôn chỉ ban đầu của TruyenDrive - đọc ngay trên Google Drive mà không cần tài về. Vì vậy, chúng ta phải tìm cách mã hóa ảnh này sao cho:
- Sau mã hóa, nó vẫn là file ảnh (để google cho phép xem trực tiếp không cần tải về).
- Giữ nguyên chất lượng ảnh trước và sau mã hóa.
- Thuật toán mã hóa/giải mã nhanh và nhẹ.

Thật ra cũng khá đơn giản, một ảnh thì được cấu thành từ hàng nghìn các điểm ảnh (pixel), mỗi pixel được tính toán dựa trên 1 công thức gồm 3 giá trị số (R)ed - (G)reen - (B)lue. Vậy chúng ta cần tìm một hàm số song ánh f, biến 3 giá trị R B G của mỗi pixel trong thành R’ G’ B’ rồi upload lên Google Drive, và khi có người muốn xem ảnh này, chúng ta dùng hàm ngược của hàm f để tính lại giá trị R B G rồi hiển thị pixel ban đầu. Thứ mà Google nhìn thấy ở server của họ là R’ G’ B’ nên họ sẽ không biết nội dung ảnh thực sự là gì. Vậy chúng ta đã xử lý được 2 vấn đề đầu tiên, ảnh sau mã hóa vẫn là ảnh, số pixel vẫn giữ nguyên nên chất lượng ảnh vẫn như cũ.

Vấn đề cuối cùng, làm sao để tìm một hàm song ánh nhanh và nhẹ? Nghĩ đến phép toán nhanh gọn thì chúng ta nghĩ ngay tới việc dùng các phép logic với mã bit 0 1, và đơn giản nhất chính là hàm đảo ngược các bit, VD: 0011 → 1100. Thế nhưng vẫn chưa đủ thử thách, tôi muốn thêm trong hàm song ánh này 1 tham số là password, tức phải truyền đúng tham số thì mới tìm được giá trị bit ban đầu. Và tôi nghĩ ngay đến phép toán XOR, ví dụ, trước khi upload: 0011 (ảnh gốc) XOR 1010 (password) = 0110 (ảnh mã hóa). Trên trình duyệt, ta lại thực hiện: 0110 (ảnh mã hóa) XOR 1010 (password) = 0011 (ảnh gốc). Đkm tuyệt vời vẻ đẹp toán học. Tôi gọi chức năng tuyệt vời này là Xor Xong Xục, viết tắt là gì thì các bạn tự hiểu.

Implement thực tế thì sẽ phức tạp hơn chút chứ không XOR trực tiếp với password, để dành phần này cho bạn nào rảnh vào đọc source code. Và chúc mừng bạn nào say đắm vẻ đẹp toán học đọc đến đây, phần thưởng cho bạn là pass cho folder trong phần bình luận: nữ sinh cao trung dễ thương bí ẩn viết liền không dấu không hoa. Nếu có ai không đọc hết bài mà hỏi pass, hãy khuyên người đó học Toán Rời Rạc mới tìm được pass.

Đó là 1 folder bao gồm 400 ảnh Biya mà không phải ở đâu cũng có, được tôi dùng để stress test và đo đạc performance của TruyenDrive. Tất nhiên là vì mục đích khoa học.

15/05/2026

12/05/2026

10/05/2026

09/05/2026

Happy goku day

Tư duy ngược đời và tư duy phản phé

21/05/2026

18/05/2026

18/05/2026

15/05/2026

12/05/2026

10/05/2026

09/05/2026

Address

Website

Alerts

Shortcuts

Share

Category