Google ra mắt Gemma 4, canh bạc lớn của họ vào trí tuệ nhân tạo mở và cục bộ.

  • Gemma 4 là một họ gồm bốn mô hình AI mở dựa trên công nghệ Gemini 3, với kích thước tham số từ E2B đến 31B.
  • Các mô hình này kết hợp khả năng "thông minh tham số" cao với khả năng thực thi cục bộ trên thiết bị di động, thiết bị biên và cơ sở hạ tầng độc quyền, nhờ vào cửa sổ ngữ cảnh lên đến 256 token.
  • Giấy phép Apache 2.0 cho phép sử dụng thương mại không hạn chế, tăng cường chủ quyền kỹ thuật số và tạo điều kiện thuận lợi cho việc triển khai trong các môi trường được quản lý chặt chẽ ở châu Âu.
  • Gemma 4 là hệ thống đa phương thức (văn bản, hình ảnh, video và âm thanh trong các mô hình nhỏ), hỗ trợ hơn 140 ngôn ngữ và hiện có sẵn trên Google AI Studio, Hugging Face, Kaggle và Ollama.

Mô hình AI Gemma 4

Google đã thực hiện một bước quan trọng trong chiến lược của mình nhằm mở trí tuệ nhân tạo Với sự ra mắt của Gemma 4, một dòng sản phẩm mới hướng đến việc kết hợp khả năng suy luận cao với yêu cầu phần cứng khiêm tốn hơn nhiều. Công ty giới thiệu thế hệ này như một lựa chọn thay thế nghiêm túc cho những ai cần chạy trí tuệ nhân tạo tiên tiến trên cơ sở hạ tầng của riêng họ, từ thiết bị di động đến trung tâm dữ liệu.

Không chỉ là một mô hình duy nhất, Gemma 4 là một dòng sản phẩm hoàn chỉnh với bốn biến thể mở.Được thiết kế dành cho các nhà phát triển, doanh nghiệp và các tổ chức công cộng muốn kiểm soát tốt hơn dữ liệu và việc triển khai của mình, đề xuất này đặc biệt phù hợp với các yêu cầu của... Chủ quyền kỹ thuật số và tuân thủ quy định ở châu ÂuTrong đó, quyền quyết định nơi thực thi và nơi lưu trữ dữ liệu ngày càng trở nên quan trọng.

Một nhóm gồm bốn mô hình tập trung vào "trí tuệ dựa trên tham số".

Dòng sản phẩm Gemma 4

Gemma 4 được xây dựng trên cùng nền tảng công nghệ với Gemini 3Nhưng với một mục tiêu rõ ràng: tối đa hóa những gì Google gọi là "Trí tuệ dựa trên tham số"Thay vì chỉ cạnh tranh về kích thước, công ty tự hào đã đạt được hiệu suất tương đương với các hệ thống lớn hơn nhiều trong các mô hình tương đối nhỏ gọn.

Gia đình bao gồm bốn kích thước khác nhau: Hiệu quả 2B (E2B), Hiệu quả 4B (E4B), một mô hình của 26B với kiến ​​trúc hỗn hợp các chuyên gia (MoE) và một biến thể dày đặc của Tham số 31BCái sau đã nằm ở Top 3 trong bảng xếp hạng của Arena AI dành cho các mô hình mở., vượt trội hơn các giải pháp thay thế nhân số lượng tham số của nó lên gấp hai mươi lần, điều này đặc biệt quan trọng đối với những người muốn giảm chi phí GPU mà không làm giảm chất lượng.

Mô hình 26B Bộ Giáo dục Nó được tối ưu hóa để chỉ kích hoạt một phần nhỏ các tham số của nó (khoảng 3,8 tỷ) trong quá trình suy luận, giúp cải thiện tốc độ tạo mã thông báo và hiệu quả năng lượng. Ngược lại, phiên bản... 31B dày đặc Nó được định vị là lựa chọn ưu tiên cho các tác vụ tinh chỉnh phức tạp, điều phối phức tạp và sử dụng chuyên sâu trong môi trường kinh doanh hoặc tổ chức.

Google nhấn mạnh rằng, xét về các tiêu chuẩn đánh giá công khai, các phiên bản này cạnh tranh trực tiếp với các mẫu máy mạnh mẽ hơn từ các nhà cung cấp khác, bao gồm cả các nhà sản xuất Trung Quốc như DeepSeek hay Qwen, những công ty đã trở nên mạnh mẽ trong hệ sinh thái mã nguồn mở những năm gần đây. Mẫu 31B của Gemma 4 được xếp hạng là mẫu mở tốt thứ ba trong Arena AI.Trong khi đó, đơn vị 26B MoE cũng được xếp hạng cao.

Từ góc độ kinh doanh, mối quan hệ giữa quy mô và hiệu suất ngụ ý điều đó. Chi phí phần cứng ít hơn, độ trễ thấp hơn và khả năng chạy các mô hình ranh giới trong một lần duy nhất. GPU NVIDIA H100 80GBĐiều này mở ra cơ hội cho các công ty tầm trung của châu Âu làm việc với trí tuệ nhân tạo tiên tiến mà không cần đầu tư vào cơ sở hạ tầng quá lớn.

Trí tuệ nhân tạo bỏ túi: thiết bị di động, IoT và điện toán biên

Gemma 4 trên thiết bị di động

Các mẫu nhỏ hơn, E2B và E4BChúng được thiết kế đặc biệt để hoạt động ở rìa mạng, tức là ở thiết bị di động, IoT và phần cứng cục bộGoogle lưu ý rằng các biến thể này được tối ưu hóa để chạy trên Điện thoại thông minh Android, Raspberry PiJetson Nano và các hệ thống tiêu thụ điện năng thấp khác, với độ trễ rất thấp và thậm chí không cần kết nối internet.

Trong phân khúc này, ưu tiên không chỉ là sức mạnh thô mà còn là khả năng mang lại... Chức năng đa phương thức và phản ứng nhanh trong môi trường hạn chế tài nguyên. Các mô hình Gemma 4 edge có thể xử lý văn bản, hình ảnh và videovà trong trường hợp của E2B và E4B, chúng bổ sung hỗ trợ gốc cho âm thanhĐiều này cho phép các trường hợp sử dụng như trợ lý giọng nói cục bộ, nhận dạng hình ảnh tại hiện trường hoặc phân tích video thời gian thực mà không cần gửi dữ liệu lên đám mây.

Cửa sổ ngữ cảnh cho các mô hình nhẹ này đạt đến 128.000 mã thông báoĐiều này đủ để xử lý các tài liệu dài, các cuộc hội thoại dài hoặc các đoạn mã liên quan chỉ trong một lần nhắc lệnh. Theo Google, sự kết hợp giữa ngữ cảnh rộng và khả năng thực thi cục bộ này giúp loại bỏ sự cản trở. quyền riêng tư, khả năng kết nối và độ trễĐiều này đặc biệt quan trọng đối với các dự án công nghiệp, y tế hoặc giáo dục ở châu Âu, nơi các quy định về xử lý dữ liệu ngày càng trở nên nghiêm ngặt.

Từ góc nhìn của các nhà sản xuất phần cứng, Gemma 4 mở ra cánh cửa cho sự tích hợp. Ứng dụng trí tuệ nhân tạo tiên tiến trực tiếp vào các sản phẩm tiêu dùngTừ điện thoại thông minh và máy tính bảng đến thiết bị y tế và cảm biến công nghiệp, công ty nhấn mạnh rằng các mẫu này được thiết kế để hoạt động với chip từ các nhà cung cấp hệ sinh thái Android phổ biến, chẳng hạn như Qualcomm và MediaTek, tạo điều kiện thuận lợi cho việc ứng dụng rộng rãi.

Hơn nữa, kiến ​​trúc của các mô hình biên tận dụng các kỹ thuật như... Nhúng từng lớp (Per-Layer Embeddings - PLE) nhằm tối đa hóa hiệu quả sử dụng tham số, cho phép suy luận và hiểu ngữ cảnh với chi phí tính toán thấp hơn nhiều so với các mô hình đa năng thông thường.

Đa phương thức, tác nhân và hỗ trợ nhà phát triển nâng cao

4 khả năng đa phương thức của Gemma

Một trong những điểm mạnh của Gemma 4 là cam kết rõ ràng của họ đối với... quy trình làm việc của tác nhânCác mô hình này không chỉ giới hạn ở việc tạo văn bản: chúng tích hợp một cách tự nhiên gọi hàm, đầu ra JSON có cấu trúc và hướng dẫn hệ thốngĐiều này cho phép xây dựng các tác nhân tự động điều phối các bước khác nhau, gọi các API bên ngoài và trả về kết quả ở các định dạng dễ dàng tích hợp với các ứng dụng doanh nghiệp.

Google khẳng định rằng tất cả các mẫu trong dòng Gemma 4 đều được thiết kế như những người suy luận cấp caoVới các chế độ tư duy có thể cấu hình để điều chỉnh độ sâu của lập luận tùy theo nhiệm vụ. Điều này dẫn đến kết quả tốt hơn trong... suy luận đa giai đoạn, tạo mã ngoại tuyến và khả năng giải quyết vấn đề phức tạp, những khía cạnh quan trọng trong môi trường quản lý doanh nghiệp và công cộng, nơi đòi hỏi sự đáng tin cậy.

Trên mặt phẳng đa phương thức, bốn mô hình có thể xử lý Văn bản và hình ảnh với độ phân giải và tỷ lệ khung hình khác nhau.Trong khi đó, các biến thể E2B và E4B mở rộng khả năng đó lên mức cao hơn. video và âm thanhSự kết hợp này cho phép tạo ra, ví dụ, các hệ thống phân tích tài liệu có đồ họa, video giám sát công nghiệp hoặc nội dung giáo dục phong phú, và tạo ra phản hồi theo ngữ cảnh trong thời gian thực.

Cửa sổ ngữ cảnh đạt đến 256.000 token trong các mô hình lớn nhấtĐiều này cho phép người dùng tải lên toàn bộ kho mã nguồn, các hợp đồng pháp lý dài dòng hoặc khối lượng lớn tài liệu kỹ thuật chỉ bằng một truy vấn duy nhất. Đối với các nhóm hỗ trợ, tư vấn hoặc kiểm toán CNTT, điều này giúp tự động hóa các tác vụ trước đây đòi hỏi nhiều giờ xem xét thủ công trở nên dễ dàng hơn.

Về mặt ngôn ngữ, Gemma 4 hỗ trợ hơn... 140 ngôn ngữĐối với châu Âu, và đặc biệt là Tây Ban Nha, điều này có nghĩa là có thể phát triển các giải pháp đa ngôn ngữ bao gồm mọi thứ từ các ngôn ngữ chính của EU đến các ngôn ngữ ít được sử dụng hơn, giúp đáp ứng các mục tiêu về khả năng tiếp cận và hòa nhập trong các dịch vụ công và tư.

Tích hợp đám mây, chủ quyền kỹ thuật số và triển khai tại châu Âu

Việc triển khai Gemma 4 không chỉ giới hạn ở phần cứng tại chỗ. Google đã tích hợp các mô hình này vào dịch vụ đám mây của mình thông qua... Đỉnh AI y Công cụ Google Kubernetes (GKE)cho phép các tổ chức cấu hình tài nguyên điện toán chuyên dụng và mở rộng quy mô khối lượng công việc suy luận theo yêu cầu. Đối với các lĩnh vực được quản lý chặt chẽ ở châu Âu, điều này được kết hợp với các tùy chọn dành cho Đám mây chủ quyền và các triển khai không kết nối mạng hoặc tại chỗ, được điều chỉnh cho phù hợp với các yêu cầu về nơi lưu trữ dữ liệu và tuân thủ Quy định chung về bảo vệ dữ liệu (GDPR).

Công ty nhấn mạnh rằng các quả cân chính xác bfloat16 của các mẫu lớn hơn có thể hoạt động hiệu quả trong một môi trường khép kín. GPU NVIDIA H100 80GB đơnGiảm bớt rào cản gia nhập thị trường cho các công ty quy mô vừa hoặc các tổ chức công muốn duy trì quyền kiểm soát cơ sở hạ tầng của họ. Trong các phiên bản lượng tử hóa, các mô hình cũng có thể hoạt động trong... phần cứng tiêu dùng hoặc máy trạm, mở rộng phạm vi các ứng dụng có thể triển khai.

Đối với các nhà quản lý công nghệ tại Tây Ban Nha và phần còn lại của châu Âu, sự kết hợp này mô hình mở, triển khai có kiểm soát và hỗ trợ đám mây độc lập Nó cho phép thiết kế các kiến ​​trúc lai: một phần trí tuệ nhân tạo có thể nằm trong các trung tâm dữ liệu cục bộ, trong khi các khối lượng công việc ít nhạy cảm hơn chạy trên đám mây công cộng, tất cả đều duy trì một nền tảng công nghệ chung.

Ngoài ra, Google còn cung cấp một Bộ phát triển tác nhân (ADK)Một khung cấu trúc mô-đun giúp đơn giản hóa việc tạo, kiểm thử và triển khai các tác nhân dựa trên Gemma 4. Nó cũng dựa vào các dịch vụ như... Chạy trên nền tảng đám mây với GPU NVIDIA RTX PRO 6000 (Blackwell) ở chế độ không máy chủ, cho phép triển khai các dự án thí điểm cường độ cao mà không cần phải mua phần cứng riêng ngay từ đầu.

Trong bối cảnh châu Âu, nơi mà cuộc tranh luận về trí tuệ nhân tạo thường xoay quanh vấn đề kiểm soát, tính minh bạch và khả năng kiểm toán, khả năng... Triển khai các mô hình mã nguồn mở trên Apache 2.0 trong môi trường hạ tầng được kiểm soát. Nó đặc biệt hấp dẫn đối với các cơ quan hành chính, ngân hàng, công ty bảo hiểm hoặc các công ty trong lĩnh vực y tế cần phải dung hòa giữa đổi mới sáng tạo với các khuôn khổ pháp lý nghiêm ngặt.

Giấy phép Apache 2.0, hệ sinh thái mở và sức hút cộng đồng.

Nếu có một khía cạnh nào đó thu hút sự quan tâm đặc biệt trong cộng đồng, thì đó chính là quyết định cấp phép cho Gemma 4 theo... Apache 2.0Các phiên bản trước đây của Gemma sử dụng giấy phép tùy chỉnh, gây ra các vấn đề pháp lý đối với các sản phẩm thương mại; giờ đây, với giấy phép mã nguồn mở tiêu chuẩn, Các nhà phát triển và công ty có thể sửa đổi, phân phối lại và kiếm tiền từ các mô hình với ít trở ngại hơn nhiều..

Việc mở cửa này diễn ra vào thời điểm Google đang cố gắng lấy lại vị thế trong hệ sinh thái mô hình mởĐiều này diễn ra sau một thời gian các giải pháp thay thế như Llama của Meta hoặc các mô hình của Trung Quốc (DeepSeek, Qwen, GLM, Minimax) đã đạt được tỷ lệ áp dụng cao. Những tiếng nói có ảnh hưởng trong lĩnh vực này, chẳng hạn như người đồng sáng lập của Hugging Face, đã mô tả động thái này là một "cột mốc quan trọng" đối với AI trong nước, nhấn mạnh rằng các nhóm pháp lý hiện có một khuôn khổ rõ ràng hơn nhiều để phê duyệt các dự án dựa trên Gemma 4.

Hệ sinh thái xung quanh gia đình Gemma đã thể hiện sức mạnh ngay cả trước phiên bản này. Google lưu ý rằng các thế hệ trước đó đã vượt trội hơn... 400 triệu lượt tải xuống và cộng đồng đã tạo ra nhiều hơn 100.000 biến thể Được điều chỉnh cho các ngôn ngữ và trường hợp sử dụng khác nhau. Trong số những ví dụ nổi bật nhất là các mô hình chuyên biệt về Tiếng Bulgaria hoặc các công cụ nghiên cứu ung thư như Cell2Sentence-Scale Được phát triển tại Đại học Yale.

Với Gemma 4, công ty hy vọng "Vũ trụ Gemma" sẽ mở rộng hơn nữa, mời gọi... Các công ty khởi nghiệp, trường đại học và trung tâm nghiên cứu châu Âu để tạo ra các sản phẩm phái sinh của riêng họ. Sự kết hợp giữa giấy phép linh hoạt và trọng số mở cho phép phát triển các phiên bản tập trung vào các lĩnh vực cụ thể, chẳng hạn như chăm sóc sức khỏe, tư pháp, Công nghiệp 4.0 hoặc giáo dục, sau đó có thể được chia sẻ hoặc tiếp thị mà không bị quá nhiều hạn chế.

Đối với các công ty Tây Ban Nha, tình hình này có nghĩa là họ có thể xây dựng các giải pháp độc quyền trên Gemma 4—chẳng hạn như trợ lý nội bộ, công cụ tìm kiếm doanh nghiệp hoặc hệ thống phân tích nâng cao—trong khi vẫn duy trì quyền kiểm soát mã nguồn, dữ liệu và cơ sở hạ tầng, điều này phù hợp với xu hướng tăng cường tính bảo mật. Chủ quyền công nghệ châu Âu.

Các trường hợp sử dụng: từ các công ty khởi nghiệp đến các tập đoàn lớn.

Gemma 4 được trang bị một loạt các tính năng đa dạng. ứng dụng tiềm năngTrong thế giới kinh doanh, mô hình có thể được sử dụng để tạo ra trợ lý ảo đa ngôn ngữ Có khả năng xử lý các truy vấn phức tạp thông qua suy luận nâng cao, hoặc tự động hóa việc tạo và xem xét mã trong các nhóm phát triển.

Các mẫu máy lớn hơn được thiết kế cho các nhiệm vụ như sau: Điều phối các tác nhân, phân tích khối lượng lớn tài liệu.Điều này bao gồm việc tạo báo cáo kỹ thuật hoặc hỗ trợ các bộ phận pháp lý và tuân thủ. Sự kết hợp giữa các cửa sổ ngữ cảnh rộng và hỗ trợ đa phương thức giúp một nhân viên duy nhất dễ dàng làm việc với hợp đồng, email, biểu đồ, hình ảnh hệ thống giám sát và bản ghi âm, tất cả trong cùng một quy trình làm việc.

Trong lĩnh vực giáo dục và khu vực công, khả năng xử lý văn bản, hình ảnh, và trong một số trường hợp là video và âm thanh, cho phép tạo ra... nền tảng hỗ trợ học tập Chúng tạo ra các bản tóm tắt, giải thích từng bước hoặc tài liệu được điều chỉnh cho các cấp độ khác nhau. Việc triển khai tại địa phương cũng giúp tôn trọng các yêu cầu về quyền riêng tư khi làm việc với dữ liệu nhạy cảm của trẻ vị thành niên hoặc các nhóm dễ bị tổn thương.

Trong lĩnh vực khởi nghiệp, Gemma 4 có thể là nền tảng của... sản phẩm theo chiều dọc Trong lĩnh vực fintech, y tế kỹ thuật số, hậu cần hoặc phần mềm dịch vụ B2B (B2B SaaS), nhờ tính linh hoạt mà Apache 2.0 cung cấp, các nhóm có thể thực hiện được nhiều việc. tinh chỉnh Họ có thể áp dụng mô hình đó vào dữ liệu của riêng mình, triển khai nó tại chỗ hoặc trên đám mây và tiếp thị kết quả mà không bị ràng buộc bởi các giấy phép độc quyền nghiêm ngặt.

Điều đặc biệt thú vị đối với châu Âu là khả năng phát triển giải pháp AI địa phương Những biện pháp này tôn trọng các quy định quốc gia và cộng đồng, ví dụ như lưu trữ dữ liệu trong các trung tâm dữ liệu đặt tại lãnh thổ châu Âu và giữ các mô hình dưới sự kiểm soát trực tiếp của tổ chức, điều này có thể là chìa khóa cho các dự án liên quan đến Quy định về Trí tuệ Nhân tạo của EU trong tương lai.

Địa điểm và cách truy cập Gemma 4

Google đã cung cấp các trọng số Gemma 4 thông qua nhiều kênh khác nhau để tạo điều kiện thuận lợi cho việc sử dụng chúng bởi các nhà phát triển và nhà nghiên cứu. Các trọng số mở có thể được tải xuống từ [liên kết]. Ôm mặt y GitHubTrong khi đó, việc sử dụng thông qua giao diện và API cũng có sẵn. Studio AI của GoogleCác tính năng tích hợp cũng được cung cấp với OllamaDocker, Kaggle và các công cụ như LM Studio.

Theo công ty, Gemma 4 có thể được vận hành cục bộ trên «hàng tỷ thiết bị Android» và trên nhiều loại phần cứng khác nhau: từ GPU máy tính xách tay và các máy trạm, cho đến các thiết bị tăng tốc phát triển chuyên dụng. Điều này phù hợp với chiến lược mở rộng trí tuệ nhân tạo tiên tiến ra ngoài các trung tâm dữ liệu lớn, vào các thiết bị của người dùng cuối và môi trường điện toán biên.

Đối với những ai muốn bắt đầu bằng các bài kiểm tra nhanh, lựa chọn trực tiếp nhất là sử dụng Studio AI của Google dành cho các mẫu 26B và 31B hoặc Thư viện Google AI Edge Trong trường hợp các biến thể E2B và E4B. Song song đó, cộng đồng nhà phát triển trên các nền tảng như Hugging Face đã và đang công bố các bản chuyển đổi và cấu hình sẵn sàng sử dụng cho các môi trường khác nhau.

Tại Tây Ban Nha và các quốc gia châu Âu khác, dự kiến ​​các nhà tích hợp hệ thống và nhà cung cấp dịch vụ quản lý địa phương sẽ bắt đầu cung cấp các dịch vụ này. Giải pháp trọn gói dựa trên Gemma 4Kết hợp triển khai điện toán đám mây độc lập, hỗ trợ tiếng Tây Ban Nha và thích ứng với các quy định cụ thể của từng lĩnh vực, chẳng hạn như dịch vụ tài chính hoặc chăm sóc sức khỏe.

Nhìn chung, việc ra mắt Gemma 4 đã đưa Google trở thành một trong những công ty hàng đầu trong lĩnh vực này. Mô hình AI mở và có thể thực thi cục bộTrong bối cảnh ngành công nghiệp châu Âu đang cần những công cụ kết hợp hiệu năng cao, khả năng kiểm soát dữ liệu và khung pháp lý rõ ràng để xây dựng các sản phẩm thương mại lâu dài.

AI cạnh bảo mật hơn
Bài viết liên quan:
Trí tuệ nhân tạo biên và quyền riêng tư: Trí tuệ nhân tạo mạnh mẽ mà không tiết lộ dữ liệu của bạn