Trang chủKhoa học - Công nghệCông nghệ sốDeepSeek đẩy mạnh ra mắt mô hình AI R2

DeepSeek đẩy mạnh ra mắt mô hình AI R2

Công ty khởi nghiệp DeepSeek của Trung Quốc, đơn vị gây ra đợt bán tháo cổ phiếu toàn cầu trị giá 1 nghìn tỷ USD với mô hình lý luận AI của mình, đang tăng tốc ra mắt R2 – phiên bản kế nhiệm của mô hình R1.

Thời điểm then chốt trong ngành công nghiệp AI

DeepSeek lên kế hoạch đẩy nhanh việc phát hành mô hình R2, ban đầu dự kiến vào tháng 5, nhằm mục đích cải thiện khả năng mã hóa và suy luận đa ngôn ngữ. Lịch trình cập nhật này chưa được tiết lộ trước đó.

DeepSeek đẩy mạnh ra mắt mô hình AI R2- Ảnh 1.

Việc ra mắt mô hình R2 của DeepSeek có thể là một thời điểm then chốt trong ngành công nghiệp AI.

Các đối thủ vẫn đang tiếp thu những hàm ý của R1, mô hình được xây dựng bằng chip Nvidia kém hơn nhưng cạnh tranh với những mô hình được phát triển với chi phí hàng trăm tỷ USD bởi các gã khổng lồ công nghệ Hoa Kỳ.

“Việc ra mắt mô hình R2 của DeepSeek có thể là một thời điểm then chốt trong ngành công nghiệp AI. Thành công của DeepSeek trong việc tạo ra các mô hình AI hiệu quả về chi phí có khả năng thúc đẩy các công ty trên toàn thế giới tăng tốc nỗ lực của riêng họ… phá vỡ sự kìm kẹp của một vài người chơi thống trị trong lĩnh vực này”, ông Vijayasimha Alilughatta – Giám đốc vận hành của nhà cung cấp dịch vụ công nghệ Ấn Độ Zensar cho biết.

Việc phát hành mô hình R2 của DeepSeek có khả năng gây lo ngại cho chính phủ Hoa Kỳ, vì nó có thể củng cố vị thế dẫn đầu về AI của Trung Quốc. Công ty, được thành lập bởi tỷ phú Liang Wenfeng (Lương Văn Phong) của quỹ đầu tư mạo hiểm High-Flyer, đã âm thầm đạt được thành tựu, với nhiều doanh nghiệp Trung Quốc tích hợp các mô hình DeepSeek. Ông Lương, người nổi tiếng về sự kín đáo, đã không phát biểu với giới truyền thông kể từ tháng 7/2024.

Theo nghiên cứu của Reuters, các tài liệu của DeepSeek kể câu chuyện về một công ty hoạt động giống như một phòng thí nghiệm nghiên cứu hơn là một doanh nghiệp vì lợi nhuận và không bị ràng buộc bởi các truyền thống phân cấp của ngành công nghệ áp lực cao của Trung Quốc, ngay cả khi nó chịu trách nhiệm về những gì nhiều nhà đầu tư coi là bước đột phá mới nhất trong AI.

Sức mạnh tính toán

Thành công của DeepSeek với mô hình AI chi phí thấp được xây dựng dựa trên khoản đầu tư kéo dài một thập kỷ của High-Flyer vào nghiên cứu AI và sức mạnh tính toán.

DeepSeek đẩy mạnh ra mắt mô hình AI R2- Ảnh 2.

Mô hình AI giá rẻ giúp DeepSeek cạnh tranh với những người khổng lồ công nghệ của Mỹ.

High-Flyer, một công ty tiên phong trong lĩnh vực giao dịch AI, đã tái đầu tư 70% doanh thu vào nghiên cứu AI, chi 1,2 tỷ nhân dân tệ cho hai cụm AI siêu máy tính trong giai đoạn 2020-2021, bao gồm Fire-Flyer II với 10.000 chip Nvidia A100.

Khoản đầu tư đáng kể này, được thực hiện trước khi DeepSeek được thành lập, đã thu hút sự chú ý của các cơ quan quản lý chứng khoán Trung Quốc. “Các cơ quan quản lý muốn biết tại sao họ cần quá nhiều chip? Họ sẽ sử dụng nó như thế nào? Loại tác động nào sẽ có đối với thị trường?”, một người thắc mắc về hoạt động của High-Flyer.

Chính quyền Trung Quốc đã chọn không can thiệp khi cụm AI Fire-Flyer II của High-Flyer, được trang bị chip Nvidia A100, hoạt động trước lúc Mỹ cấm xuất khẩu A100 sang Trung Quốc vào năm 2022.

DeepSeek hiện đang nhận được sự hỗ trợ từ Bắc Kinh nhưng đã được chỉ thị không được tiếp xúc với giới truyền thông nếu không được chấp thuận. Các nhà chức trách lo ngại rằng việc công khai quá nhiều có thể thu hút sự chú ý không mong muốn.

Với cụm A100 lớn, High-Flyer và DeepSeek đã thu hút được những tài năng nghiên cứu hàng đầu tại Trung Quốc.

Kiến trúc AI tiết kiệm chi phí

Một số doanh nhân AI phương Tây, như Giám đốc điều hành Scale AI Alexandr Wang, đã tuyên bố rằng DeepSeek có tới 50.000 chip Nvidia cao cấp bị cấm xuất khẩu sang Trung Quốc. Ông đã không đưa ra bằng chứng cho cáo buộc này hoặc trả lời các yêu cầu của Reuters để cung cấp bằng chứng.

DeepSeek đẩy mạnh ra mắt mô hình AI R2- Ảnh 3.

Ông Lương Văn Phong (phải) trong cuộc họp với các nhà lãnh đạo hàng đầu Trung Quốc.

Hai cựu nhân viên cho rằng thành công của công ty là do sự tập trung của ông Lương vào kiến trúc AI hiệu quả về chi phí hơn.

DeepSeek đã sử dụng các kỹ thuật hiệu quả về chi phí như Mixture-of-Experts (MoE) và multihead latent attention (MLA) để đạt được hiệu suất mô hình AI với chi phí chỉ bằng một phần nhỏ so với các đối thủ cạnh tranh.

MoE chỉ kích hoạt các khu vực liên quan của mô hình, trong khi MLA xử lý nhiều khía cạnh thông tin cùng một lúc. Các mô hình của DeepSeek rẻ hơn từ 20 đến 40 lần so với các mô hình tương đương của OpenAI, thúc đẩy các đối thủ như OpenAI và Google giảm giá và điều chỉnh chiến lược. Thành công của DeepSeek với các mô hình R1 và V3 đã ảnh hưởng đến sự thay đổi giá cả trong ngành công nghiệp AI.

Adnan Masood của nhà cung cấp dịch vụ công nghệ Hoa Kỳ, UST, nói rằng phòng thí nghiệm của ông đã chạy các điểm chuẩn và phát hiện ra rằng R1 thường sử dụng số lượng token (đơn vị dữ liệu được xử lý bởi mô hình AI) gấp ba lần để suy luận so với mô hình thu nhỏ của OpenAI.

Sự hỗ trợ từ nhà nước

Trước khi R1 thu hút sự chú ý toàn cầu, DeepSeek đã nhận được sự ủng hộ từ Bắc Kinh. Vào tháng 1, ông Lương đã gặp Thủ tướng Trung Quốc Lý Cường với tư cách là đại diện lĩnh vực AI, trước các lãnh đạo từ các công ty nổi tiếng.

DeepSeek đẩy mạnh ra mắt mô hình AI R2- Ảnh 4.

Ông Lưu Văn Phong được gặp Chủ tịch Trung Quốc, Tập Cận Bình (phải).

Thành công của các mô hình hiệu quả về chi phí của DeepSeek đã củng cố niềm tin của Bắc Kinh vào khả năng vượt trội về đổi mới so với Hoa Kỳ của Trung Quốc, với việc các công ty và cơ quan chính phủ Trung Quốc nhanh chóng áp dụng các mô hình của DeepSeek.

Ít nhất 13 chính quyền thành phố Trung Quốc và 10 công ty năng lượng thuộc sở hữu nhà nước cho biết họ đã triển khai DeepSeek vào hệ thống, trong khi các gã khổng lồ công nghệ Lenovo, Baidu và Tencent – chủ sở hữu ứng dụng truyền thông xã hội lớn nhất Trung Quốc WeChat – đã tích hợp các mô hình của DeepSeek vào sản phẩm.

“Lãnh đạo Trung Quốc Tập Cận Bình và Lý Cường đã phát tín hiệu ủng hộ DeepSeek. Bây giờ mọi người đều ủng hộ ứng dụng này”, Alfred Wu, một chuyên gia về hoạch định chính sách Trung Quốc tại Trường Chính sách Công Lý Quang Diệu của Singapore nói.

Sự đón nhận của Trung Quốc diễn ra khi các chính phủ từ Hàn Quốc đến Italia gỡ bỏ DeepSeek khỏi các cửa hàng ứng dụng quốc gia, với lý do lo ngại về quyền riêng tư.

“Nếu DeepSeek trở thành mô hình AI được sử dụng rộng rãi trên khắp các thực thể nhà nước Trung Quốc, các cơ quan quản lý phương Tây có thể coi đây là một lý do khác để leo thang các hạn chế đối với chip AI hoặc hợp tác phần mềm”, một chuyên gia AI và người sáng lập quỹ đầu tư mạo hiểm Carthage Capital, Stephen Wu nhận định.

Các hạn chế hơn nữa đối với chip AI tiên tiến là một thách thức mà ông Lương đã thừa nhận: “Vấn đề của chúng tôi chưa bao giờ là tài chính, mà là lệnh cấm vận đối với chip cao cấp”, ông Lương nói với Waves vào hồi tháng 7/2014.



Nguồn: https://www.baogiaothong.vn/deepseek-day-manh-ra-mat-mo-hinh-ai-r2-192250226172118017.htm

Cùng chủ đề

Alibaba công khai mô hình AI để tạo video, hình ảnh

Công ty thương mại điện tử hàng đầu Trung Quốc, Alibaba hôm nay (26/2) đã công khai mô hình trí tuệ nhân tạo sản xuất video và hình ảnh Wan 2.1 - hoặc mã nguồn mở, động thái có thể làm tăng mức sử dụng và cạnh tranh trong lĩnh vực AI. ...

DeepSeek cam kết công khai mã mô hình AI, tăng gấp đôi nguồn mở

Công ty khởi nghiệp Trung Quốc, DeepSeek hôm nay (21/2) tuyên bố sẽ công khai mã các mô hình, cam kết tăng cường gấp đôi trí tuệ nhân tạo nguồn mở. ...

Người dùng OpenAI tăng vọt lên hơn 400 triệu

Người dùng hoạt động hàng tuần của OpenAI đã tăng vọt lên hơn 400 triệu kể từ đầu tháng 2, con số cho thấy sự tăng trưởng nhanh chóng trong việc áp dụng các công cụ trí tuệ nhân tạo vào ChatGPT. ...

Cựu giám đốc OpenAI ra mắt công ty khởi nghiệp AI

Cựu giám đốc công nghệ OpenAI, Mira Murati, đã ra mắt công ty khởi nghiệp AI đặt tên là Thinking Machines Lab vào hôm qua (18/2), với khoảng 30 nhà nghiên cứu và kỹ sư hàng đầu gia nhập từ các đối thủ cạnh tranh trong đó có OpenAI, Meta và Mistral. ...

Thừa nhận vi phạm, DeepSeek bị chặn tải mới tại Hàn Quốc

Cơ quan bảo vệ dữ liệu Hàn Quốc hôm nay (17/2) đã chặn không cho người dùng nước này tải mới DeepSeek, sau khi ứng dụng AI của Trung Quốc thừa nhận không tính đến một số quy tắc về bảo vệ dữ liệu cá nhân tại xứ sở kim chi. ...

Nổi bật

Mới nhất

Cùng tác giả

Đưa dịch vụ mặt đất tại các cảng hàng không đạt chuẩn quốc tế

Tổng công ty Cảng hàng không Việt Nam - CTCP và Cảng hàng không quốc tế Phú Quốc vừa được Hiệp hội Vận tải hàng không quốc tế (IATA) cấp chứng nhận an toàn khai thác mặt đất theo tiêu chuẩn quốc tế - ISAGO. ...

Ba gói thầu Vành đai 3 TP.HCM qua Đồng Nai cùng tăng tốc chạy đua tiến độ

Hiện nay mặt bằng chỉ còn vướng 2 hộ, khó khăn còn lại là vật liệu san lấp nên các nhà thầu đã huy động thêm nhân sự, máy móc để tăng tốc làm cầu, đường trên Vành đai 3 qua Đồng Nai. “Hiện nay mặt bằng đã cơ bản ổn, chỉ còn vướng khoảng 2 hộ. Tuy nhiên, do trước đây vướng mặt bằng lâu, toàn các vị trí quan trọng nên ảnh hưởng đến tiến độ. Do...

Giám đốc Sở Xây dựng Ninh Thuận sau sáp nhập là ai?

Ông Nguyễn Văn Vinh (47 tuổi), Giám đốc Sở GTVT vừa được bổ nhiệm làm Giám đốc Sở Xây dựng tỉnh Ninh Thuận sau hợp nhất, tinh gọn bộ máy. ...

Bộ trưởng Trần Hồng Minh thị sát cảng Cẩm Phả, Lạch Huyện

Ngày 26/2, Bộ trưởng Trần Hồng Minh dẫn đầu đoàn công tác kiểm tra, khảo sát cảng Cẩm Phả (Quảng Ninh) và cảng Lạch Huyện (Hải Phòng), trước khi làm việc với các địa phương về công tác quy hoạch, phát triển hệ thống cảng biển. ...

Phát huy vai trò cứu nạn hàng hải, góp phần bảo vệ chủ quyền biển đảo

Đây là chỉ đạo của Bộ trưởng Trần Hồng Minh tại buổi làm việc với lực lượng tìm kiếm cứu nạn hàng hải tại Hải Phòng chiều nay (26/2). ...

Bài đọc nhiều

Công ty mẹ Facebook đàm phán xây dựng trung tâm dữ liệu AI hơn 200 tỷ USD

Theo tiết lộ từ The Information, công ty mẹ của nền tảng xã hội phổ biến Facebook, Meta Platforms đang thảo luận để xây dựng trung tâm dữ liệu mới cho các dự án trí tuệ nhân tạo với chi phí hơn 200 tỷ USD. ...

Một số thông tin về smartphone gập 3 của Samsung

Mới đây, Samsung đã tiết lộ một số thông tin về điện thoại gập 3 của mình tại sự kiện ra mắt Galaxy S25. Theo đó, hãng xác nhận đang phát triển một mẫu điện thoại thông minh có thể gập với nhiều bản lề, hứa hẹn mang tới trải nghiệm đột phá cho người dùng. Nhà phân tích Ross Young, thiết bị này sẽ có màn hình chính khoảng 10 inch khi mở ra hoàn toàn. Tuy nhiên, về...

Mỹ đề nghị cơ quan chống độc quyền châu Âu làm rõ các quy tắc kiểm soát Big Tech

Chủ tịch Tư pháp Hạ viện Hoa Kỳ, Jim Jordan hôm qua (23/2) đã yêu cầu giám đốc chống độc quyền của Liên minh châu Âu (EU) Teresa Ribera làm rõ cách thực thi các quy tắc của khối trong việc kiểm soát các doanh nghiệp công nghệ lớn - Big Tech. ...

Cùng chuyên mục

Alibaba công khai mô hình AI để tạo video, hình ảnh

Công ty thương mại điện tử hàng đầu Trung Quốc, Alibaba hôm nay (26/2) đã công khai mô hình trí tuệ nhân tạo sản xuất video và hình ảnh Wan 2.1 - hoặc mã nguồn mở, động thái có thể làm tăng mức sử dụng và cạnh tranh trong lĩnh vực AI. ...

Mới nhất

Những lời kêu gọi bạc tỉ đầy hoài nghi

(NLĐO) - Mạng xã hội đã trở thành "mảnh đất màu mỡ" cho những lời kêu gọi từ thiện, đánh vào lòng trắc ẩn ...

Môn thi thứ ba vào lớp 10 của Hà Nội là Ngoại ngữ

Chiều tối 26/2, Sở GD&ĐT Hà Nội đã công bố môn thi thứ ba vào lớp 10 THPT công lập năm học 2025-2026. Theo đó, thực hiện Quy chế tuyển sinh trung học cơ sở và tuyển sinh THPT ban hành kèm...

Chức năng, nhiệm vụ, quyền hạn và, cơ cấu tổ chức của Bộ Giáo dục và Đào tạo

Chính phủ ban hành Nghị định 37/2025/NĐ-CP ngày 26/2/2025 quy định chức năng, nhiệm vụ, quyền hạn và...

Bản hùng ca người chiến sĩ áo trắng

Tối ngày 26/2/2025, tại Hà Nội, Bộ Y tế, Ban Tuyên giáo Trung ương phối hợp cùng với Báo Sức khỏe đời sống tổ chức Lễ Kỷ niệm 70 năm Ngày Thầy thuốc Việt Nam (27/2/1955 - 27/2/2025) với chủ đề “Bản hùng ca người chiến sĩ áo trắng”. Kỷ niệm 70 năm ngày Thầy thuốc Việt Nam: Bản...

Mới nhất