Trang chủKhoa học - Công nghệCông nghệ sốMô hình ngôn ngữ lớn và hiểu biết nhất của OpenAI ra...

Mô hình ngôn ngữ lớn và hiểu biết nhất của OpenAI ra mắt


Mô hình ngôn ngữ mới của OpenAI dựa trên nền tảng GPT-4 trước đó nhưng được mở rộng và cải tiến trong quá trình đào tạo. Mặc dù không phải là tiên tiến nhất, nhưng GPT-4.5 tự hào sở hữu nhiều kiến thức hơn, kỹ năng viết được cải thiện và tính cách tinh tế hơn so với phiên bản trước.

Theo dữ liệu chuẩn, GPT-4.5 là một bản nâng cấp khiêm tốn so với GPT-4. Trên chuẩn SWE-bench Verified, mô hình này đạt 38%, tăng từ 2-7% so với GPT-4, nhưng vẫn thấp hơn 30% so với nghiên cứu sâu dựa trên o3 của OpenAI. Để so sánh, mô hình Claude 3.7 Sonnet của Anthropic đạt hiệu suất 62,3% trên cùng chuẩn này. Trên điểm chuẩn về Độ chính xác của SimpleQA, GPT-4.5 đạt 62,5%, so với 38,2% của GPT-4. Tuy nhiên, trên điểm chuẩn Tỷ lệ ảo giác của SimpleQA, GPT-4.5 lại có điểm thấp nhất trong số các mô hình ngôn ngữ lớn của OpenAI.

Đáp ứng các chuẩn mực mới của OpenAI

Mới đây, nhóm Preparedness của OpenAI đã phát triển một chuẩn mực mới mang tên SWE-Lancer nhằm đánh giá hiệu suất của các mô hình ngôn ngữ lớn trong các tác vụ kỹ thuật phần mềm thực tế như phát triển tính năng và sửa lỗi. Trong chuẩn mực này, GPT-4.5 có thể giải quyết 20% tác vụ IC SWE và 44% tác vụ SWE Manager, cải thiện một chút so với mô hình trước đó.

Về mặt an toàn, nhóm tư vấn an toàn của OpenAI đã phân loại GPT-4.5 là có rủi ro trung bình, với điểm số thấp trong các lĩnh vực an ninh mạng và tính tự chủ của mô hình.

Người dùng ChatGPT Pro hiện đã có thể trải nghiệm bản xem trước của mô hình GPT-4.5 thông qua trình chọn mô hình trên web, thiết bị di động và máy tính để bàn. Mô hình này hỗ trợ tìm kiếm, tải tệp, hình ảnh và các tính năng canvas trên ChatGPT. Các tính năng đa phương thức như Voice Mode, video và chia sẻ màn hình sẽ được bổ sung trong tương lai.

GPT-4.5 sẽ chính thức có mặt vào tuần tới cho người dùng ChatGPT Plus và Teams, cũng như cho tất cả các nhà phát triển trả phí thông qua API Chat Completions, API Assistants và API Batch, với các tính năng nổi bật như gọi hàm, Structured Outputs, Streaming và tin nhắn hệ thống.

1_112.jpg

VOV.VN – Microsoft vừa thông báo rằng 2 tính năng AI Think Deeper và Voice của Copilot hiện đã có sẵn miễn phí với quyền truy cập không giới hạn cho mọi người.



Nguồn: https://vov.vn/cong-nghe/tin-cong-nghe/mo-hinh-ngon-ngu-lon-va-hieu-biet-nhat-cua-openai-ra-mat-post1158650.vov

Cùng chủ đề

Hai siêu AI miễn phí mới của Baidu thách thức Deepseek và OpenAI

(CLO) Baidu vừa công bố hai mô hình AI mới, Ernie 4.5 và Ernie X1, nhằm cạnh tranh trực tiếp với các đối thủ mạnh như DeepSeek và OpenAI trong cuộc đua trí tuệ nhân tạo ngày càng khốc liệt. ...

Alibaba ra mắt mô hình AI mã nguồn mở phân tích cảm xúc con người qua video

Phòng thí nghiệm Thông Nghĩa (Tongyi) của Alibaba hôm thứ Ba (11/3) đã công bố mô hình R1-Omni dưới dạng mã nguồn mở. Đây được coi là mô hình ngôn ngữ đa phương thức toàn diện đầu tiên, ứng dụng kỹ thuật học tăng cường với phần thưởng có thể xác minh (RLVR) – một công nghệ hứa hẹn nâng cao khả năng suy luận và phân tích cảm xúc của AI. Nhóm phát triển cho biết, họ đã...

OpenAI trình làng công cụ phát triển mới

OpenAI vừa ra mắt công cụ mới cho các nhà phát triển vào hôm qua (11/3), giúp xây dựng các tác nhân AI tiên tiến, sử dụng giao diện lập trình ứng dụng (API), trong bối cảnh cạnh tranh ngày càng gia tăng từ các công ty khởi nghiệp AI của Trung Quốc. ...

hệ thống AI mới của Trung Quốc mạnh thế nào

(CLO) Được ra mắt vào ngày 6/3, chỉ trong vài ngày, Manus của Trung Quốc đã gây xôn xao trong giới công nghệ khi được so sánh với Deepseek, cũng như các mô hình AI tiên tiến nhất của OpenAI, Google và Anthropic. ...

Chỉ sau 10 ngày ra mắt, công ty khởi nghiệp AI non trẻ được định giá 9 tỷ USD

Theo nguồn tin từ Business Insider, công ty khởi nghiệp AI của bà của bà Mira Murati, Thinking Machines Lab đang nhắm mục tiêu huy động 1 tỷ USD với mức định giá khoảng 9 tỷ USD. ...

Nổi bật

Mới nhất

Cùng tác giả

Một số cổ phiếu cần quan tâm ngày 17/3

► Nhận định chứng khoán 17/3: Nhà đầu tư nên thận trọng, hạn chế mua mới Khuyến nghị mua đối với cổ phiếu PTB Công ty Chứng khoán Vietcap (VCSC) điều chỉnh giảm 12% giá mục tiêu của CTCP Phú Tài (PTB) xuống mức 71.000 đồng/cổ phiếu nhưng nâng khuyến nghị từ khả quan lên mua. Giá cổ phiếu của PTB đã giảm 21% kể từ Báo cáo cập nhật gần nhất của chúng tôi vào tháng 7/2024. Mức giảm đối...

Khám phá ‘chất riêng’ trong phong cách thời trang của Tứ đại Thanh Y

"Thanh Y" là mỹ từ chỉ những nữ diễn viên ở độ tuổi 30-45, người đã khẳng định được vị thế vững chắc trong sự nghiệp. Họ được ngưỡng mộ không chỉ bởi khả năng diễn xuất đỉnh cao, mà còn bởi sự chuyên nghiệp, nghiêm túc và luôn nỗ lực hoàn thiện bản thân. Những cái tên Thang Duy, Lý Băng Băng, Cao Viên Viên và Diêu Thần đã từng là biểu tượng cho danh xưng cao quý...

VN-Index có thể thử thách lại mức hỗ trợ gần nhất 1.320

VN-Index có thể chịu áp lực điều chỉnh Dưới ảnh hưởng tích cực của các cổ phiếu VIC, VHM, VRE... VN-IN-Index tiếp tục tăng lên vùng 1.340 điểm, VN30 tăng lên vùng kháng cự mạnh quanh 1.400 điểm. Áp lực bán gia tăng mở rộng ở nhiều mã trong vùng giá này, áp lực bán với khối lượng đột biến hơn trong phiên chiều. Dẫn đến kết phiên giao dịch ngày 13/3, VN-Index giảm -8,14 điểm (-0,61%) về mức...

Một số cổ phiếu cần quan tâm ngày 14/3

Khuyến nghị mua dành cho cổ phiếu PC1 Theo Công ty Chứng khoán KB Việt Nam (KBSV), năm 2024, CTCP Tập đoàn PC1 (PC1) hoàn thành 93% mục tiêu doanh thu và 134% mục tiêu lợi nhuận sau thuế đề ra. Mảng EPC của PC1 sẽ phục hồi tích cực trong 2025 (doanh thu đạt 5.142 tỷ đồng, tăng 18% so với năm trước) với backlog xây lắp và sản xuất công nghiệp đến cuối 2024 lần lượt đạt 6.892/493...

Alibaba ra mắt mô hình AI mã nguồn mở phân tích cảm xúc con người qua video

Phòng thí nghiệm Thông Nghĩa (Tongyi) của Alibaba hôm thứ Ba (11/3) đã công bố mô hình R1-Omni dưới dạng mã nguồn mở. Đây được coi là mô hình ngôn ngữ đa phương thức toàn diện đầu tiên, ứng dụng kỹ thuật học tăng cường với phần thưởng có thể xác minh (RLVR) – một công nghệ hứa hẹn nâng cao khả năng suy luận và phân tích cảm xúc của AI. Nhóm phát triển cho biết, họ đã...

Bài đọc nhiều

Galaxy Tab S10 FE lộ hiệu năng trên Geekbench

Samsung đang phát triển bộ đôi máy tính tầm trung mới là Galaxy Tab S10 FE và Galaxy Tab S10 FE Plus. Mới đây, biến thể tiêu chuẩn vừa được phát hiện trên Geekbench với một vài thông số kỹ thuật chính. Theo đó, Galaxy Tab S10 FE sắp ra mắt sẽ được trang bị chip Exynos 1580- chipset hiện đang được sử dụng bên trong Galaxy A56. Điều này giúp tăng hiệu suất đáng kể so với chip...

Apple sắp trang bị tính năng đặc biệt cho tai nghe AirPods

Theo thông tin mới nhất, Apple được cho là sẽ trang bị tính năng phiên dịch trực tiếp lên tai nghe AirPods từ cuối năm nay, hứa hẹn mang lại trải nghiệm tốt hơn cho người dùng.

Cùng chuyên mục

Gemini có thể phải đối mặt với vấn đề vi phạm bản quyền

Dòng Pixel 9 của Google đã gây ấn tượng với các tính năng AI Gemini, đặc biệt là khả năng tạo hình ảnh chất lượng cao, kể từ khi ra mắt vào tháng 8 năm ngoái. Đến giữa tháng 3/2025, Google đã nâng cấp mạnh mẽ cho Gemini với phiên bản Gemini 2.0 Flash Thingking Experimental. Mô hình này giúp nâng cao trải nghiệm của người dùng trong việc tạo và chỉnh sửa hình ảnh. Tuy nhiên, điều này...

Mới nhất

5 công thức làm sườn nướng ngon bất bại, tha hồ đổi món vì cực dễ, thịt mềm thơm nức mũi, đậm đà hương...

GĐXH - Sườn nướng là món ăn “khoái khẩu” đối với nhiều người. Tuy nhiên, để có công thức ướp sườn chuẩn, đậm đà hương vị không phải ai cũng nắm bắt được. Vì vậy, trong bài viết này...

Giải pháp tổng thể, bền vững để ổn định mức sinh

Mức sinh trên toàn quốc đang giảm dưới mức sinh thay thế, khi số con trung bình của một phụ nữ trong độ tuổi sinh đẻ giảm từ 2,11 (năm 2021) xuống 2,01 (năm 2022), 1,96 (năm 2023) và 1,91 (năm 2024) và dự báo sẽ tiếp tục giảm trong những năm tới. Việc giảm xuống dưới mức...

Mùa khô năm nay, chuyện nước sinh hoạt ở huyện này của Long An được giải quyết theo cách nào?

Huyện ủy, UBND huyện Cần Giuộc (Long An) vừa có buổi làm việc với các ngành, UBND các xã, thị trấn, công ty cấp nước về tình hình cấp nước sinh...

Xu hướng cà vạt tăng nhiệt, trở thành món phụ kiện thời trang đầy sáng tạo

Có thể nói, cà vạt là món phụ kiện có lịch sử lâu đời và từng là hiện thân của quyền lực nam giới. Nhưng giờ đây nó không còn tuân theo các quy tắc truyền thống nữa, mà...

Trải nghiệm Novruz Bayram – lễ hội văn hoá độc đáo của người Azerbaijan tại Việt Nam

Novruz Bayram là một trong những ngày lễ quan trọng nhất của Azerbaijan, được UNESCO công nhận là di sản văn hóa phi vật thể, đồng thời được Liên hợp quốc lấy ngày 21/3 là Ngày Novruz quốc tế.

Mới nhất