AI đang là công nghệ nóng nhất thế giới, và không ngạc nhiên khi các ông lớn công nghệ đua nhau tung ra những sáng tạo mới để chiếm lĩnh vị thế trong kỷ nguyên trí tuệ nhân tạo. Mới đây, tại sự kiện Google Cloud Next ’25, Google đã chính thức giới thiệu Ironwood – thế hệ chip TPU (Tensor Processing Unit) thứ 7 của hãng, được thiết kế đặc biệt cho các mô hình AI.
Không giống những thế hệ trước vốn tập trung vào huấn luyện AI từ đầu, Ironwood được tối ưu cho giai đoạn suy luận (inferencing) – nơi AI không chỉ học, mà còn phải suy nghĩ, phân tích và đưa ra dự đoán. Đây cũng là nền tảng cho “kỷ nguyên suy luận” mà Google đang hướng tới, nơi các tác nhân AI sẽ chủ động xử lý và tổng hợp thông tin để đưa ra câu trả lời có chiều sâu thay vì chỉ cung cấp dữ liệu đơn thuần..

Ironwood không chỉ mang triết lý mới mà còn có thông số kỹ thuật cực kỳ ấn tượng: khi hoạt động ở quy mô lớn với 9.216 chip trên mỗi cụm, nó đạt tới 42,5 exaflops – cao gấp 24 lần so với El Capitan, siêu máy tính nhanh nhất thế giới hiện tại (1,7 exaflops).
Ngoài sức mạnh tính toán, Ironwood còn sở hữu 192 GB bộ nhớ HBM – cao gấp 6 lần thế hệ trước là Trillium. Băng thông bộ nhớ cũng đạt 7,2 terabit/giây mỗi chip, tăng gấp 4,5 lần. Theo đại diện Google, điều này không chỉ tăng hiệu suất mà còn giúp tiết kiệm điện năng, một yếu tố đang trở nên ngày càng quan trọng trong cuộc đua AI toàn cầu.
Không dừng lại ở phần cứng, Google còn công bố rằng Ironwood sẽ là nền tảng vận hành các mô hình AI hàng đầu của hãng, bao gồm Gemini 2.5. Tại sự kiện, Google cũng ra mắt Gemini 2.5 Flash – phiên bản nhẹ, giá rẻ hơn của Gemini, được thiết kế để phản hồi nhanh và linh hoạt tùy theo độ phức tạp của yêu cầu.
Trong một màn trình diễn trực tiếp, Google còn giới thiệu hệ sinh thái AI sáng tạo đa phương tiện của mình: từ text-to-image, text-to-video cho đến công cụ mới text-to-music có tên Lyria. Các mô hình này phối hợp với nhau để tạo ra một video quảng bá buổi hòa nhạc hoàn chỉnh – tất cả chỉ từ lời mô tả văn bản.
Tuy Ironwood đang chiếm sóng, Google khẳng định đây chỉ là một phần trong chiến lược hạ tầng AI tổng thể. Gã khổng lồ tìm kiếm cũng ra mắt Cloud WAN – mạng diện rộng được quản lý hoàn toàn, giúp doanh nghiệp truy cập trực tiếp vào hạ tầng mạng của Google với hiệu suất cao hơn 40% và chi phí vận hành thấp hơn 40%.
Đọc bài gốc tại đây.