Thế hệ mô hình mới của DeepSeek đã trở thành tâm điểm của cuộc tranh luận công nghệ với một đề xuất rất rõ ràng: bối cảnh lên đến một triệu token và kiến trúc với hơn một nghìn tỷ tham số. Được thiết kế để hoạt động hiệu quả và trên hết là rẻ hơn nhiều so với các giải pháp vòng kín ở Hoa Kỳ, công ty Trung Quốc đã dồn toàn lực vào V4, một dòng sản phẩm kết hợp trọng số mở, cửa sổ ngữ cảnh rộng lớn và chiến lược định giá cạnh tranh.
Động thái này diễn ra vào thời điểm châu Âu và Tây Ban Nha đang xem xét kỹ lưỡng chi phí và chủ quyền công nghệ của trí tuệ nhân tạo. DeepSeek V4 tự khẳng định mình là một lựa chọn hấp dẫn cho các công ty khởi nghiệp, doanh nghiệp vừa và nhỏ cũng như các công ty lớn tại châu Âu. những người cần các khả năng ở cấp độ tiên tiến, nhưng không thể—hoặc không muốn—hoàn toàn dựa vào các API độc quyền đắt tiền hoặc phần cứng độc quyền như các GPU NVIDIA được săn đón nhất.
Một dòng V4 tập trung vào 1T tham số và bối cảnh gồm 1M token.

DeepSeek vừa công bố sự ra mắt của DeepSeek-V4 Preview, một bộ mô hình mã nguồn mở xoay quanh hai ý tưởng: một cửa sổ ngữ cảnh với tối đa 1 triệu token và các kiến trúc khổng lồ dựa trên mô hình Mixture-of-Experts (MoE)Trong dòng sản phẩm này, có hai biến thể chính nổi bật: DeepSeek-V4-Pro và DeepSeek-V4-Flash, cả hai đều có thông số 1M làm đặc điểm nổi bật.
Ở mức độ tham vọng nhất, V4-Pro đạt được các thông số như sau: tối đa 1,6 nghìn tỷ tham số tổng cộng (1,6T), mặc dù chỉ kích hoạt từ 32 đến 49 tỷ tham số trong mỗi bước suy luận nhờ vào lược đồ MoE, điều này rất quan trọng để duy trì hiệu quả. Song song đó, công ty đã giới thiệu các biến thể nhẹ hơn, chẳng hạn như V4-Flash và V4-Lite, với tổng số khoảng 284-285 tỷ tham số và khoảng 13 tỷ tham số hoạt động, được thiết kế cho các triển khai mà tốc độ và chi phí là ưu tiên hàng đầu.
Tổng số thông số kỹ thuật đưa dòng xe V4 lên vị trí dẫn đầu thị trường, nhưng chi tiết quan trọng là... Chỉ một phần nhỏ trong số các chuyên gia đó được kích hoạt bằng mã thông báo.Điều này cho phép nó hoạt động như một mô hình khổng lồ về dung lượng, nhưng mức tiêu thụ điện năng tính toán lại gần với các mô hình nhỏ hơn nhiều. Đây là một cách tiếp cận phù hợp với câu chuyện của DeepSeek: cạnh tranh với các mô hình lớn, mã nguồn đóng mà không làm tăng vọt chi phí sử dụng.
Công ty cũng đã phát hành các phiên bản thử nghiệm như V4-Lite, đóng vai trò là bước kiểm định kỹ thuật, và đang điều chỉnh lịch trình triển khai. Mặc dù vậy, V4 hiện vẫn đang trong giai đoạn thử nghiệm hạn chế. Trong một số trường hợp, dòng sản phẩm V4 Preview đã có thể được sử dụng trong chatbot chính thức và thông qua API được cập nhật của công ty, với ngữ cảnh 1M là giá trị mặc định trong các dịch vụ của nó.
Kiến trúc lai và sự kết hợp của các chuyên gia để tạo ra bối cảnh khả thi lâu dài.
Chìa khóa giúp DeepSeek có thể cung cấp cửa sổ ngữ cảnh gồm một triệu token mà không làm tăng vọt chi phí suy luận nằm ở kiến trúc của nó. Nhà sản xuất giải thích rằng V4 giới thiệu sự kết hợp giữa chăm sóc tổng hợp, đội ngũ chuyên gia và kỹ thuật nén ép. Được thiết kế để hoạt động với các chuỗi rất dài, giúp giảm cả số phép tính FLOP trên mỗi token và dung lượng bộ nhớ cần thiết.
Trong số các thành phần kỹ thuật mà công ty đề cập, những điểm sau đây nổi bật: MLA (Multi-Head Latent Attention), DSA hoặc DeepSeek Sparse Attention, và các cơ chế bộ nhớ có điều kiện như Engram.Nhìn chung, các thành phần này nhằm mục đích giảm bớt gánh nặng tính toán sự chú ý, đặc biệt khi mô hình phải xử lý hàng trăm nghìn hoặc một triệu token trong một lần xử lý duy nhất.
Theo dữ liệu do chính công ty chia sẻ, trong trường hợp có 1 triệu token. DeepSeek-V4-Pro có thể chỉ cần khoảng 27% số phép tính FLOPs trên mỗi token và chỉ 10% bộ nhớ cache KV so với các phiên bản trước như DeepSeek-V3.2.Các phiên bản nhẹ hơn, chẳng hạn như V4-Flash, còn giảm thêm các con số này, định vị mình là giải pháp suy luận nhanh cho các ứng dụng mà độ trễ là yếu tố quan trọng.
Những cải tiến này không chỉ mang tính lý thuyết: công ty khẳng định rằng sự kết hợp giữa MoE, khả năng tập trung phân tán và hiểu ngữ cảnh cho phép... hoạt động với bối cảnh cực dài trong phần cứng ít cực đoan hơn Chi phí trên mỗi triệu token hiện đã thấp hơn đáng kể so với nhiều mô hình khép kín với số lượng token tối thiểu là 128 hoặc 200.
Hiệu suất trong các nhiệm vụ suy luận, lập trình và tác chiến.
DeepSeek không chỉ muốn nổi bật vì quy mô và bối cảnh của mình. Trong các so sánh nội bộ, công ty khẳng định rằng V4-Pro và các biến thể của nó đã được tối ưu hóa đặc biệt cho suy luận phức tạp, lập trình và tác nhân.Ba lĩnh vực này hiện chiếm một phần đáng kể nhu cầu kinh doanh. Các tiêu chuẩn như SWE-bench, được thiết kế để đo lường năng lực của... Hiểu và chỉnh sửa kho mã nguồnCó thông tin cho rằng độ chính xác đạt trên 80%, tương đương với các mô hình khép kín hàng đầu.
Trong lập luận tổng quát hơn—bao gồm toán học, các ngành STEM và các bài toán về chuỗi suy luận—công ty đánh giá V4-Pro là giải pháp tối ưu. là một trong những mô hình mở mạnh mẽ nhấtvà lập luận rằng nó đang tiến gần đến mức độ của các đề xuất về biên giới khép kín. Về nhận thức toàn cầu, dữ liệu nội bộ đặt nó ở vị trí hàng đầu trong hệ sinh thái mở và chỉ đứng sau một vài mô hình độc quyền rất cụ thể, chẳng hạn như... một số biến thể nâng cao của Gemini.
Ngoài những con số, sự nhấn mạnh vào nhiệm vụ tác nhân Điều này cho thấy một ứng dụng vượt xa chức năng trò chuyện thông thường. DeepSeek khẳng định rằng V4 hiện đã tự vận hành cơ sở hạ tầng gồm các tác nhân mã và hệ thống kết nối nhiều bước.Họ truy cập các công cụ và làm việc trên các kho lưu trữ hoặc cơ sở dữ liệu tài liệu rộng lớn. Cách tiếp cận này phù hợp với xu hướng hiện tại của ngành, nơi nhiều công ty không chỉ tìm kiếm chatbot mà còn tìm kiếm các trợ lý có khả năng hoạt động như "đồng nghiệp kỹ thuật số" trong các quy trình làm việc phức tạp.
Những so sánh này cần được xem xét một cách thận trọng: cũng giống như hầu hết các sản phẩm AI mới ra mắt gần đây, Phần lớn dữ liệu đến từ chính công ty và từ các thử nghiệm trong môi trường được kiểm soát.Tuy nhiên, sự kết hợp giữa khả năng xử lý dữ liệu lâu dài, kiến trúc hiệu quả và hiệu năng cạnh tranh đang thu hút sự chú ý của các nhà phát triển châu Âu, những người đang so sánh chi phí và khả năng của nó với các lựa chọn khác như GPT, Claude, Llama hoặc Mistral.
Mô hình mở, trọng số được công bố và khả năng tương thích với các API phổ biến.
Một trong những yếu tố then chốt mang lại danh tiếng cho DeepSeek là cam kết của công ty đối với hệ sinh thái mở. Với V4, công ty tiếp tục củng cố phương pháp tiếp cận này: đã công bố báo cáo kỹ thuật và phát hành trọng lượng mở của dòng sản phẩm trên các nền tảng như Hugging Face.cho phép các nhà nghiên cứu, công ty và cơ quan hành chính công tải xuống các mô hình và chạy chúng trên cơ sở hạ tầng của riêng họ.
Cách tiếp cận công khai này, trái ngược với các đề xuất hoàn toàn khép kín của nhiều phòng thí nghiệm Hoa Kỳ, có những tác động rõ ràng đối với Tây Ban Nha và Liên minh châu Âu. Khả năng triển khai các mô hình này trong các trung tâm dữ liệu trong EUtheo các khuôn khổ như GDPR và quy định về trí tuệ nhân tạo trong tương lai của EU.Nó cung cấp một cách để duy trì khả năng kiểm soát dữ liệu tốt hơn mà không làm giảm đi các chức năng hàng đầu.
Về mặt tích hợp thực tiễn, DeepSeek đã lựa chọn phương án giảm thiểu sự cản trở: API này duy trì cùng một base_url và tương thích với các lược đồ ChatCompletions của OpenAI cũng như với... Giao diện nhân tạoĐối với nhiều nhóm phát triển, điều này có nghĩa là việc chuyển đổi các bài kiểm tra hoặc một phần lưu lượng truy cập sang V4 về cơ bản chỉ giới hạn ở việc thay đổi mã định danh mô hình thành deepseek-v4-pro hoặc deepseek-v4-flash và điều chỉnh một vài tham số.
Đồng thời, công ty cũng đã đặt ra lộ trình ngừng hỗ trợ các mô hình cũ hơn, chẳng hạn như deepseek-chat và deepseek-reasoner. Chúng sẽ bị ngừng hoạt động và chuyển hướng sang V4-Flash. cho đến khi chúng bị rút hoàn toàn, điều này buộc những người đã sử dụng chúng phải bắt đầu chuẩn bị cho việc chuyển đổi. Đây là một cách rõ ràng để tập trung vào thế hệ mới và tránh phân mảnh cơ sở người dùng thành quá nhiều biến thể cũ.
Giảm thiểu chi phí suy luận và tập trung vào hiệu quả kinh tế.
Từ khi thành lập, DeepSeek luôn xoay quanh hiệu quả. Với phiên bản V4, điều đó được củng cố bởi sự kết hợp giữa kiến trúc MoE, cơ chế chú ý phân tán và tối ưu hóa phần cứng nhằm mục đích... giảm chi phí trên mỗi triệu token xuống mức thấp hơn nhiều so với các API cao cấp nổi tiếng nhất.Một số phân tích bên ngoài đề cập đến con số khoảng 0,30 đô la cho mỗi triệu token truy cập đối với một số cấu hình nhất định, chỉ bằng một phần nhỏ so với mức phí mà các mô hình khép kín cao cấp tính phí.
Trong bối cảnh châu Âu, nơi chi phí cơ sở hạ tầng và năng lượng là yếu tố quan trọng, việc tập trung vào hiệu quả này rất phù hợp với nhu cầu của các công ty khởi nghiệp và doanh nghiệp vừa và nhỏ. Xử lý các tài liệu pháp lý đồ sộ, hồ sơ y tế dài dòng hoặc toàn bộ kho phần mềm. Nó không còn là một thứ xa xỉ chỉ dành riêng cho các công ty có ngân sách gần như không giới hạn, mà trở thành một phần của những giải pháp khả thi cho các dự án mới nổi.
Một số nhà cung cấp cơ sở hạ tầng AI đã cung cấp quyền truy cập sớm vào các node dựa trên DeepSeek V4 như một phần trong danh mục sản phẩm của họ, giúp các công ty châu Âu dễ dàng tiếp cận hơn. Họ có thể đánh giá hiệu suất và chi phí thực tế mà không cần phải xây dựng cơ sở hạ tầng từ đầu.Đối với nhiều tổ chức, giai đoạn thử nghiệm này là bước sơ bộ trước khi quyết định tiếp tục mô hình thuê ngoài hay lựa chọn triển khai tại chỗ.
Trong khi đó, việc công ty giữ im lặng một phần về chi phí đào tạo chính xác và phần cứng cụ thể được sử dụng đã làm dấy lên nghi ngờ trong một số lĩnh vực. Kể từ năm 2025, những nghi ngờ đã lan truyền về khối lượng tài nguyên thực sự cần thiết để đào tạo các mô hình của họ, bao gồm cả những ước tính chỉ ra hàng chục nghìn GPU cao cấp. DeepSeek khẳng định họ đã đạt được một giai đoạn mới của "bối cảnh dài hạn có lợi nhuận".Nhưng điều đó vẫn chưa hoàn toàn làm sáng tỏ những điều chưa biết về quy mô vật chất trong các hoạt động của nó.
Tác động đến các công ty khởi nghiệp và doanh nghiệp tại Tây Ban Nha và châu Âu
Đối với hệ sinh thái khởi nghiệp châu Âu, và đặc biệt là các công ty khởi nghiệp công nghệ tại Tây Ban Nha, sự xuất hiện của các mô hình như DeepSeek V4 mở ra những lựa chọn mà cho đến gần đây vẫn khó có thể nghĩ tới. Truy cập mô hình với hơn một nghìn tỷ tham số trong bối cảnh 1 triệu token và trọng số mở. Điều này cho phép bạn khám phá các sản phẩm tiên tiến mà không cần phụ thuộc hoàn toàn vào các nhà cung cấp ở Thung lũng Silicon.
Trong các lĩnh vực được quản lý chặt chẽ — tài chính, y tế, pháp luật, hành chính công — khả năng Chạy mô hình trong các trung tâm dữ liệu thuộc EU hoặc thậm chí ngay tại cơ sở của riêng bạn. Điều này đặc biệt quan trọng. Việc tuân thủ GDPR và các quy định bảo vệ dữ liệu quốc gia trở nên dễ quản lý hơn khi thông tin không cần phải rời khỏi phạm vi pháp lý của châu Âu để được xử lý bởi mô hình AI.
Các công ty khởi nghiệp Tây Ban Nha hoạt động trong lĩnh vực xử lý số lượng lớn tài liệu, chẳng hạn như công nghệ pháp lý, công nghệ y tế hoặc công cụ dành cho nhà phát triển, có thể tận dụng bối cảnh 1 triệu token để phân tích toàn bộ hồ sơ, bệnh án rất dài hoặc kho mã nguồn khổng lồ. mà không cần phải chia chúng thành nhiều phần và thiết kế các hệ thống phục hồi phức tạp. Điều này làm giảm độ phức tạp về mặt kỹ thuật và trong nhiều trường hợp, cả độ trễ nữa.
Đồng thời, điều quan trọng là phải luôn ghi nhớ các rủi ro: hệ sinh thái các công cụ xung quanh DeepSeek còn non trẻ hơn so với các mô hình mở khác như Llama, và Tài liệu hướng dẫn và sự hỗ trợ từ cộng đồng vẫn đang trong quá trình hoàn thiện.Hơn nữa, việc đây là một công ty Trung Quốc mang đến một yếu tố địa chính trị mà một số tổ chức châu Âu xem xét một cách thận trọng, đặc biệt là trong các dự án liên quan đến chính quyền hoặc cơ sở hạ tầng trọng yếu.
Động thái này gây áp lực lên các mô hình khép kín, chi phí cao.
Ngoài các thông số kỹ thuật cụ thể, DeepSeek V4 còn được hiểu trong ngành là... một bước tiến nữa trong việc gia tăng áp lực cạnh tranh đối với các mẫu xe mui kín đắt tiền nhất trên thị trường.Bằng cách thiết lập ngữ cảnh token 1M làm tiêu chuẩn trên tất cả các dịch vụ chính thức của mình và kèm theo đó là trọng số công khai, công ty Trung Quốc này đã gửi một thông điệp rõ ràng: ngữ cảnh siêu dài hạn không còn cần phải là tính năng độc quyền của một vài mô hình độc quyền có giá cao nữa.
Đối với các phòng thí nghiệm lớn ở phương Tây, đây là một thách thức. OpenAI, Anthropic và Google từ trước đến nay đã sử dụng kết hợp nhiều phương pháp. chất lượng cao hơn, bối cảnh rộng hơn và hệ sinh thái độc quyền như một đề xuất giá trị. Sự xuất hiện của một giải pháp thay thế mở với bối cảnh thậm chí còn vượt trội hơn trong một số trường hợp và chi phí rất thấp buộc phải xem xét lại các chiến lược sản phẩm và định giá, đặc biệt là trong các phân khúc mà biên lợi nhuận của các công ty người dùng rất eo hẹp.
Tại các quốc gia nói tiếng Tây Ban Nha, nơi nhiều công ty khởi nghiệp hoạt động với ngân sách khiêm tốn hơn nhiều so với các công ty cùng ngành ở Hoa Kỳ, áp lực cạnh tranh lại có lợi cho họ. Càng nhiều mô hình mạnh mẽ và mở hơn, các nhóm kỹ thuật càng có nhiều khả năng lựa chọn dựa trên giá cả, tuân thủ quy định và trường hợp sử dụng.và không chỉ đến từ thương hiệu đứng sau API đó.
Đồng thời, DeepSeek biết rằng canh bạc của họ không phải không có thách thức: hầu hết các điểm chuẩn và so sánh đều đến từ tài liệu của chính họ hoặc từ các thử nghiệm trong giai đoạn xem trước, và thị trường vẫn đang chờ xem các mẫu V4 hoạt động như thế nào khi được triển khai rộng rãi trong các môi trường sản xuất đòi hỏi cao, bao gồm cả các môi trường ở châu Âu.
Nhìn chung, sự ra mắt của DeepSeek V4 củng cố một xu hướng đã phát triển trong một thời gian: Các mô hình AI tiên tiến không còn là lĩnh vực độc quyền của một vài công ty với hệ thống khép kín và ngân sách khổng lồ nữa.Với sự kết hợp của hơn 1 nghìn tỷ tham số, bối cảnh 1 triệu token, trọng số mở và một diễn ngôn tập trung vào hiệu quả, công ty Trung Quốc này giới thiệu một giải pháp thay thế mà các công ty và nhà phát triển ở Tây Ban Nha và châu Âu khó có thể bỏ qua trong các kế hoạch sắp tới của họ về việc áp dụng và đổi mới cơ sở hạ tầng AI.