Trang chủKhoa học - Công nghệCông nghệ sốMô hình ngôn ngữ lớn và hiểu biết nhất của OpenAI ra...

Mô hình ngôn ngữ lớn và hiểu biết nhất của OpenAI ra mắt


Mô hình ngôn ngữ mới của OpenAI dựa trên nền tảng GPT-4 trước đó nhưng được mở rộng và cải tiến trong quá trình đào tạo. Mặc dù không phải là tiên tiến nhất, nhưng GPT-4.5 tự hào sở hữu nhiều kiến thức hơn, kỹ năng viết được cải thiện và tính cách tinh tế hơn so với phiên bản trước.

Theo dữ liệu chuẩn, GPT-4.5 là một bản nâng cấp khiêm tốn so với GPT-4. Trên chuẩn SWE-bench Verified, mô hình này đạt 38%, tăng từ 2-7% so với GPT-4, nhưng vẫn thấp hơn 30% so với nghiên cứu sâu dựa trên o3 của OpenAI. Để so sánh, mô hình Claude 3.7 Sonnet của Anthropic đạt hiệu suất 62,3% trên cùng chuẩn này. Trên điểm chuẩn về Độ chính xác của SimpleQA, GPT-4.5 đạt 62,5%, so với 38,2% của GPT-4. Tuy nhiên, trên điểm chuẩn Tỷ lệ ảo giác của SimpleQA, GPT-4.5 lại có điểm thấp nhất trong số các mô hình ngôn ngữ lớn của OpenAI.

Đáp ứng các chuẩn mực mới của OpenAI

Mới đây, nhóm Preparedness của OpenAI đã phát triển một chuẩn mực mới mang tên SWE-Lancer nhằm đánh giá hiệu suất của các mô hình ngôn ngữ lớn trong các tác vụ kỹ thuật phần mềm thực tế như phát triển tính năng và sửa lỗi. Trong chuẩn mực này, GPT-4.5 có thể giải quyết 20% tác vụ IC SWE và 44% tác vụ SWE Manager, cải thiện một chút so với mô hình trước đó.

Về mặt an toàn, nhóm tư vấn an toàn của OpenAI đã phân loại GPT-4.5 là có rủi ro trung bình, với điểm số thấp trong các lĩnh vực an ninh mạng và tính tự chủ của mô hình.

Người dùng ChatGPT Pro hiện đã có thể trải nghiệm bản xem trước của mô hình GPT-4.5 thông qua trình chọn mô hình trên web, thiết bị di động và máy tính để bàn. Mô hình này hỗ trợ tìm kiếm, tải tệp, hình ảnh và các tính năng canvas trên ChatGPT. Các tính năng đa phương thức như Voice Mode, video và chia sẻ màn hình sẽ được bổ sung trong tương lai.

GPT-4.5 sẽ chính thức có mặt vào tuần tới cho người dùng ChatGPT Plus và Teams, cũng như cho tất cả các nhà phát triển trả phí thông qua API Chat Completions, API Assistants và API Batch, với các tính năng nổi bật như gọi hàm, Structured Outputs, Streaming và tin nhắn hệ thống.

1_112.jpg

VOV.VN – Microsoft vừa thông báo rằng 2 tính năng AI Think Deeper và Voice của Copilot hiện đã có sẵn miễn phí với quyền truy cập không giới hạn cho mọi người.



Nguồn: https://vov.vn/cong-nghe/tin-cong-nghe/mo-hinh-ngon-ngu-lon-va-hieu-biet-nhat-cua-openai-ra-mat-post1158650.vov

Cùng chủ đề

Hai siêu AI miễn phí mới của Baidu thách thức Deepseek và OpenAI

(CLO) Baidu vừa công bố hai mô hình AI mới, Ernie 4.5 và Ernie X1, nhằm cạnh tranh trực tiếp với các đối thủ mạnh như DeepSeek và OpenAI trong cuộc đua trí tuệ nhân tạo ngày càng khốc liệt. ...

Alibaba ra mắt mô hình AI mã nguồn mở phân tích cảm xúc con người qua video

Phòng thí nghiệm Thông Nghĩa (Tongyi) của Alibaba hôm thứ Ba (11/3) đã công bố mô hình R1-Omni dưới dạng mã nguồn mở. Đây được coi là mô hình ngôn ngữ đa phương thức toàn diện đầu tiên, ứng dụng kỹ thuật học tăng cường với phần thưởng có thể xác minh (RLVR) – một công nghệ hứa hẹn nâng cao khả năng suy luận và phân tích cảm xúc của AI. Nhóm phát triển cho biết, họ đã...

OpenAI trình làng công cụ phát triển mới

OpenAI vừa ra mắt công cụ mới cho các nhà phát triển vào hôm qua (11/3), giúp xây dựng các tác nhân AI tiên tiến, sử dụng giao diện lập trình ứng dụng (API), trong bối cảnh cạnh tranh ngày càng gia tăng từ các công ty khởi nghiệp AI của Trung Quốc. ...

hệ thống AI mới của Trung Quốc mạnh thế nào

(CLO) Được ra mắt vào ngày 6/3, chỉ trong vài ngày, Manus của Trung Quốc đã gây xôn xao trong giới công nghệ khi được so sánh với Deepseek, cũng như các mô hình AI tiên tiến nhất của OpenAI, Google và Anthropic. ...

Chỉ sau 10 ngày ra mắt, công ty khởi nghiệp AI non trẻ được định giá 9 tỷ USD

Theo nguồn tin từ Business Insider, công ty khởi nghiệp AI của bà của bà Mira Murati, Thinking Machines Lab đang nhắm mục tiêu huy động 1 tỷ USD với mức định giá khoảng 9 tỷ USD. ...

Nổi bật

Mới nhất

Cùng tác giả

Một số cổ phiếu cần quan tâm ngày 17/3

► Nhận định chứng khoán 17/3: Nhà đầu tư nên thận trọng, hạn chế mua mới Khuyến nghị mua đối với cổ phiếu PTB Công ty Chứng khoán Vietcap (VCSC) điều chỉnh giảm 12% giá mục tiêu của CTCP Phú Tài (PTB) xuống mức 71.000 đồng/cổ phiếu nhưng nâng khuyến nghị từ khả quan lên mua. Giá cổ phiếu của PTB đã giảm 21% kể từ Báo cáo cập nhật gần nhất của chúng tôi vào tháng 7/2024. Mức giảm đối...

Khám phá ‘chất riêng’ trong phong cách thời trang của Tứ đại Thanh Y

"Thanh Y" là mỹ từ chỉ những nữ diễn viên ở độ tuổi 30-45, người đã khẳng định được vị thế vững chắc trong sự nghiệp. Họ được ngưỡng mộ không chỉ bởi khả năng diễn xuất đỉnh cao, mà còn bởi sự chuyên nghiệp, nghiêm túc và luôn nỗ lực hoàn thiện bản thân. Những cái tên Thang Duy, Lý Băng Băng, Cao Viên Viên và Diêu Thần đã từng là biểu tượng cho danh xưng cao quý...

VN-Index có thể thử thách lại mức hỗ trợ gần nhất 1.320

VN-Index có thể chịu áp lực điều chỉnh Dưới ảnh hưởng tích cực của các cổ phiếu VIC, VHM, VRE... VN-IN-Index tiếp tục tăng lên vùng 1.340 điểm, VN30 tăng lên vùng kháng cự mạnh quanh 1.400 điểm. Áp lực bán gia tăng mở rộng ở nhiều mã trong vùng giá này, áp lực bán với khối lượng đột biến hơn trong phiên chiều. Dẫn đến kết phiên giao dịch ngày 13/3, VN-Index giảm -8,14 điểm (-0,61%) về mức...

Một số cổ phiếu cần quan tâm ngày 14/3

Khuyến nghị mua dành cho cổ phiếu PC1 Theo Công ty Chứng khoán KB Việt Nam (KBSV), năm 2024, CTCP Tập đoàn PC1 (PC1) hoàn thành 93% mục tiêu doanh thu và 134% mục tiêu lợi nhuận sau thuế đề ra. Mảng EPC của PC1 sẽ phục hồi tích cực trong 2025 (doanh thu đạt 5.142 tỷ đồng, tăng 18% so với năm trước) với backlog xây lắp và sản xuất công nghiệp đến cuối 2024 lần lượt đạt 6.892/493...

Alibaba ra mắt mô hình AI mã nguồn mở phân tích cảm xúc con người qua video

Phòng thí nghiệm Thông Nghĩa (Tongyi) của Alibaba hôm thứ Ba (11/3) đã công bố mô hình R1-Omni dưới dạng mã nguồn mở. Đây được coi là mô hình ngôn ngữ đa phương thức toàn diện đầu tiên, ứng dụng kỹ thuật học tăng cường với phần thưởng có thể xác minh (RLVR) – một công nghệ hứa hẹn nâng cao khả năng suy luận và phân tích cảm xúc của AI. Nhóm phát triển cho biết, họ đã...

Bài đọc nhiều

Galaxy Tab S10 FE lộ hiệu năng trên Geekbench

Samsung đang phát triển bộ đôi máy tính tầm trung mới là Galaxy Tab S10 FE và Galaxy Tab S10 FE Plus. Mới đây, biến thể tiêu chuẩn vừa được phát hiện trên Geekbench với một vài thông số kỹ thuật chính. Theo đó, Galaxy Tab S10 FE sắp ra mắt sẽ được trang bị chip Exynos 1580- chipset hiện đang được sử dụng bên trong Galaxy A56. Điều này giúp tăng hiệu suất đáng kể so với chip...

Apple sắp trang bị tính năng đặc biệt cho tai nghe AirPods

Theo thông tin mới nhất, Apple được cho là sẽ trang bị tính năng phiên dịch trực tiếp lên tai nghe AirPods từ cuối năm nay, hứa hẹn mang lại trải nghiệm tốt hơn cho người dùng.

Cùng chuyên mục

iPhone gập sẽ có giá gấp đôi iPhone 16 Pro Max

Theo nhà phân tích Tim Long của Barclays, nếu iPhone gập có giá từ 2.299 USD thì giá của nó gần gấp đôi so với iPhone 16 Pro Max - giá khởi điểm 1.199 USD. Ông cho biết: trong chuyến công tác tới Châu Á, nhóm của ông đã gặp gỡ các nhà sản xuất linh kiện phần cứng và được biết, chuỗi cung ứng đang thảo luận nhiều hơn một mẫu iPhone gập có thể ra mắt vào...

Mới nhất

Sân bay quốc tế Đà Nẵng hoàn thiện xuất nhập cảnh tự động 100%

(NLĐO) – Cảng Hàng không quốc tế Đà Nẵng là sân bay đầu tiên tại Việt Nam tự động hóa 100% các quy trình, thủ tục xuất...

Thế hệ trẻ kế thừa truyền thống, mang tương lai tươi sáng cho quan hệ Việt-Trung

Ngày 20/3, tại Cung Hữu nghị Việt-Trung (Hà Nội), Bộ Ngoại giao chủ trì, phối hợp với Liên hiệp các tổ chức hữu nghị Việt Nam, Đài Truyền hình Việt Nam và Thông tấn xã Việt Nam tổ chức Chương trình “Gặp gỡ lưu học sinh, sinh viên Việt Nam-Trung Quốc các thời kỳ,” nhân dịp kỷ niệm...

Xuất khẩu sầu riêng ‘bớt nóng’

Trung Quốc siết kiểm tra vàng O và Cadimi khiến xuất khẩu sầu riêng của Việt Nam chậm lại. Đây cũng là thời điểm sốc lại ngành hàng này sau thời gian tăng nóng. Thị trường đã thông nhưng doanh nghiệp vẫn ngại Nếu như vào thời điểm này năm ngoái, sầu riêng...

Nga đánh sập 146 căn cứ Ukraine

Hàng trăm lính Ukraine tử nạn; Nga đánh sập 146 căn cứ Ukraine,... là những tin tức đáng chú ý sẽ có trong bản tin chiến sự Nga-Ukraine chiều 20/3. Nga tiến công vũ bão, đánh sập 146 căn cứ Ukraine Cập nhật tình hình chiến sự Nga - Ukraine, theo hãng thông...

Giá cà phê Robusta tăng lên mức 5.527 USD/tấn

Theo MXV, giá cà phê Arabica ghi nhận mức tăng 1,89% so với tham chiếu đạt 8.621 USD/tấn, trong khi giá cà phê Robusta cũng tăng 1,06% lên mức 5.527 USD/tấn. Theo Sở Giao dịch Hàng hóa Việt Nam (MXV), sắc xanh áp đảo trên thị trường hàng hóa nguyên liệu thế giới trong phiên giao...

Mới nhất