Trang chủKhoa học - Công nghệCông nghệ sốMô hình ngôn ngữ lớn và hiểu biết nhất của OpenAI ra...

Mô hình ngôn ngữ lớn và hiểu biết nhất của OpenAI ra mắt


Mô hình ngôn ngữ mới của OpenAI dựa trên nền tảng GPT-4 trước đó nhưng được mở rộng và cải tiến trong quá trình đào tạo. Mặc dù không phải là tiên tiến nhất, nhưng GPT-4.5 tự hào sở hữu nhiều kiến thức hơn, kỹ năng viết được cải thiện và tính cách tinh tế hơn so với phiên bản trước.

Theo dữ liệu chuẩn, GPT-4.5 là một bản nâng cấp khiêm tốn so với GPT-4. Trên chuẩn SWE-bench Verified, mô hình này đạt 38%, tăng từ 2-7% so với GPT-4, nhưng vẫn thấp hơn 30% so với nghiên cứu sâu dựa trên o3 của OpenAI. Để so sánh, mô hình Claude 3.7 Sonnet của Anthropic đạt hiệu suất 62,3% trên cùng chuẩn này. Trên điểm chuẩn về Độ chính xác của SimpleQA, GPT-4.5 đạt 62,5%, so với 38,2% của GPT-4. Tuy nhiên, trên điểm chuẩn Tỷ lệ ảo giác của SimpleQA, GPT-4.5 lại có điểm thấp nhất trong số các mô hình ngôn ngữ lớn của OpenAI.

Đáp ứng các chuẩn mực mới của OpenAI

Mới đây, nhóm Preparedness của OpenAI đã phát triển một chuẩn mực mới mang tên SWE-Lancer nhằm đánh giá hiệu suất của các mô hình ngôn ngữ lớn trong các tác vụ kỹ thuật phần mềm thực tế như phát triển tính năng và sửa lỗi. Trong chuẩn mực này, GPT-4.5 có thể giải quyết 20% tác vụ IC SWE và 44% tác vụ SWE Manager, cải thiện một chút so với mô hình trước đó.

Về mặt an toàn, nhóm tư vấn an toàn của OpenAI đã phân loại GPT-4.5 là có rủi ro trung bình, với điểm số thấp trong các lĩnh vực an ninh mạng và tính tự chủ của mô hình.

Người dùng ChatGPT Pro hiện đã có thể trải nghiệm bản xem trước của mô hình GPT-4.5 thông qua trình chọn mô hình trên web, thiết bị di động và máy tính để bàn. Mô hình này hỗ trợ tìm kiếm, tải tệp, hình ảnh và các tính năng canvas trên ChatGPT. Các tính năng đa phương thức như Voice Mode, video và chia sẻ màn hình sẽ được bổ sung trong tương lai.

GPT-4.5 sẽ chính thức có mặt vào tuần tới cho người dùng ChatGPT Plus và Teams, cũng như cho tất cả các nhà phát triển trả phí thông qua API Chat Completions, API Assistants và API Batch, với các tính năng nổi bật như gọi hàm, Structured Outputs, Streaming và tin nhắn hệ thống.

1_112.jpg

VOV.VN – Microsoft vừa thông báo rằng 2 tính năng AI Think Deeper và Voice của Copilot hiện đã có sẵn miễn phí với quyền truy cập không giới hạn cho mọi người.



Nguồn: https://vov.vn/cong-nghe/tin-cong-nghe/mo-hinh-ngon-ngu-lon-va-hieu-biet-nhat-cua-openai-ra-mat-post1158650.vov

Cùng chủ đề

ChatGPT được tăng cường mạnh mẽ khả năng tạo và chỉnh ảnh

(CLO) OpenAI vừa công bố một loạt cải tiến đáng chú ý cho ChatGPT, giúp người dùng dễ dàng tạo và chỉnh sửa hình ảnh ngay trong giao diện trò chuyện. ...

Hai siêu AI miễn phí mới của Baidu thách thức Deepseek và OpenAI

(CLO) Baidu vừa công bố hai mô hình AI mới, Ernie 4.5 và Ernie X1, nhằm cạnh tranh trực tiếp với các đối thủ mạnh như DeepSeek và OpenAI trong cuộc đua trí tuệ nhân tạo ngày càng khốc liệt. ...

Nổi bật

Mới nhất

Cùng tác giả

Một số cổ phiếu cần quan tâm ngày 17/3

► Nhận định chứng khoán 17/3: Nhà đầu tư nên thận trọng, hạn chế mua mới Khuyến nghị mua đối với cổ phiếu PTB Công ty Chứng khoán Vietcap (VCSC) điều chỉnh giảm 12% giá mục tiêu của CTCP Phú Tài (PTB) xuống mức 71.000 đồng/cổ phiếu nhưng nâng khuyến nghị từ khả quan lên mua. Giá cổ phiếu của PTB đã giảm 21% kể từ Báo cáo cập nhật gần nhất của chúng tôi vào tháng 7/2024. Mức giảm đối...

Khám phá ‘chất riêng’ trong phong cách thời trang của Tứ đại Thanh Y

"Thanh Y" là mỹ từ chỉ những nữ diễn viên ở độ tuổi 30-45, người đã khẳng định được vị thế vững chắc trong sự nghiệp. Họ được ngưỡng mộ không chỉ bởi khả năng diễn xuất đỉnh cao, mà còn bởi sự chuyên nghiệp, nghiêm túc và luôn nỗ lực hoàn thiện bản thân. Những cái tên Thang Duy, Lý Băng Băng, Cao Viên Viên và Diêu Thần đã từng là biểu tượng cho danh xưng cao quý...

VN-Index có thể thử thách lại mức hỗ trợ gần nhất 1.320

VN-Index có thể chịu áp lực điều chỉnh Dưới ảnh hưởng tích cực của các cổ phiếu VIC, VHM, VRE... VN-IN-Index tiếp tục tăng lên vùng 1.340 điểm, VN30 tăng lên vùng kháng cự mạnh quanh 1.400 điểm. Áp lực bán gia tăng mở rộng ở nhiều mã trong vùng giá này, áp lực bán với khối lượng đột biến hơn trong phiên chiều. Dẫn đến kết phiên giao dịch ngày 13/3, VN-Index giảm -8,14 điểm (-0,61%) về mức...

Một số cổ phiếu cần quan tâm ngày 14/3

Khuyến nghị mua dành cho cổ phiếu PC1 Theo Công ty Chứng khoán KB Việt Nam (KBSV), năm 2024, CTCP Tập đoàn PC1 (PC1) hoàn thành 93% mục tiêu doanh thu và 134% mục tiêu lợi nhuận sau thuế đề ra. Mảng EPC của PC1 sẽ phục hồi tích cực trong 2025 (doanh thu đạt 5.142 tỷ đồng, tăng 18% so với năm trước) với backlog xây lắp và sản xuất công nghiệp đến cuối 2024 lần lượt đạt 6.892/493...

Alibaba ra mắt mô hình AI mã nguồn mở phân tích cảm xúc con người qua video

Phòng thí nghiệm Thông Nghĩa (Tongyi) của Alibaba hôm thứ Ba (11/3) đã công bố mô hình R1-Omni dưới dạng mã nguồn mở. Đây được coi là mô hình ngôn ngữ đa phương thức toàn diện đầu tiên, ứng dụng kỹ thuật học tăng cường với phần thưởng có thể xác minh (RLVR) – một công nghệ hứa hẹn nâng cao khả năng suy luận và phân tích cảm xúc của AI. Nhóm phát triển cho biết, họ đã...

Bài đọc nhiều

Lần đầu tiên phóng thiết bị bay không người lái vào tâm bão

Các nhà nghiên cứu thuộc Cục Quản lý khí quyển và hải dương quốc gia Mỹ (NOAA) vừa thực hiện một nhiệm vụ đột phá, mang tính dấu mốc khi phóng các thiết bị bay không người lái bay sâu vào tâm bão để thu thập dữ liệu khí tượng về cách thức cơn bão hình thành và mạnh lên.

Người dùng iPhone 7 series có thể được bồi thường 349 USD

Được biết, vào năm 2023, Apple đã bị cáo buộc tập thể rằng iPhone 7 và iPhone 7 Plus dễ gặp sự cố âm thanh do chip bị lỗi trong thiết bị. Công ty đã đồng ý chi trả 35 triệu USD cho cáo buộc này và những người nộp đơn khiếu nại sẽ bắt đầu được thanh toán trong tháng này. Theo 9to5Mac, nhiều người yêu cầu bồi thường nhận được khoảng 200  USD và có người nhận...

Xiaomi 15 Ultra sẽ có hệ thống camera cao cấp

Xiaomi đã chính thức xác nhận Xiaomi 15 Ultra sẽ ra mắt ngày 27/2 với hệ thống máy ảnh khủng thông qua các poster quảng cáo. Ở các thị trường khác nhau, thiết bị sẽ cạnh tranh với các điện thoại cao cấp mang thương hiệu Ultra khác như Galaxy S25 Ultra, Vivo X200 Ultra và Oppo Find X8 Ultra. Theo đó, Xiaomi 15 Ultra sẽ ra mắt "hệ thống quang học Leica Ultra-Pure" mới, được thiết kế để...

Cách sử dụng Monica công cụ AI siêu thông minh mà bạn nên biết

Monica là một trợ lý ảo thông minh tích hợp nhiều tính năng khác nhau, giúp bạn quản lý công việc, sắp xếp thông tin hiệu quả trên điện thoại và máy tính. Bài viết dưới đây sẽ hướng dẫn bạn cách sử dụng Monica để tận dụng tối đa những tiện ích mà nó mang lại.

Cách xem thời gian sử dụng ứng dụng trên Samsung siêu đơn giản

Xem thời gian sử dụng ứng dụng trên Samsung là tính năng hữu ích, giúp bạn theo dõi, quản lý thời gian truy cập một cách hiệu quả. Bài viết dưới đây sẽ hướng dẫn bạn cách kiểm tra, xem thời gian sử dụng ứng dụng trên điện thoại Samsung nhanh và đơn giản nhất.

Cùng chuyên mục

Doanh nghiệp Nhà nước phải xông pha hơn nữa để thúc đẩy tăng trưởng

DNVN - Phát biểu chỉ đạo Hội nghị Thủ tướng Chính phủ làm việc với doanh nghiệp Nhà nước tiên phong trong chuyển đổi số và thúc đẩy tăng trưởng, ngày 15/4, Thủ tướng Phạm Minh Chính yêu cầu doanh nghiệp Nhà nước phải xông pha hơn nữa để thúc đẩy tăng trưởng. ...

33,3% dân số ở Hàn Quốc sử dụng AI tạo sinh

Theo khảo sát của Chính phủ Hàn Quốc, 33,3% dân số đã sử dụng AI tạo sinh như ChatGPT trong năm 2024.

Phát triển dữ liệu để đưa Việt Nam trở thành quốc gia số

Chuyển đổi số, với dữ liệu là trung tâm đang làm thay đổi căn bản cách chúng ta sống, làm việc và phát triển. Việt Nam cần làm gì để tiếp cận cơ hội này?.

Mới nhất

Cuộc chiến thuế quan, nhà đầu tư trú ẩn vào các cổ phiếu nào?

Các chính sách thuế quan thường thay đổi nhanh và trong bối cảnh như hiện nay, nhà đầu tư không nên hoảng loạn, có thể tìm kiếm nơi “trú ẩn” bằng cách đầu tư vào các công ty hàng đầu, có nội lực để chống chọi được với khủng hoảng. Cuộc chiến thuế quan, nhà đầu tư "trú ẩn"...

Hai người phụ nữ hiếm hoi trong lịch sử từng được trao huy chương Fields

Trong số 64 nhà toán học được trao huy chương Fields ở lĩnh vực toán học chỉ có hai người phụ nữ. Đó là nhà toán học người Iran Maryam Mirzakhani và nhà toán học người Ukraine Maryna Viazovska. ...

Tuyển giáo viên trước sáp nhập đơn vị hành chính: Nơi tự tạm dừng, nơi tiếp tục tuyển

Tại tỉnh Ninh Thuận có huyện tiếp tục tuyển giáo viên để đảm bảo việc dạy học, nhưng có nơi lại tạm dừng vì lý do sắp xếp, sáp nhập đơn vị hành chính. ...

Sữa tăng trưởng chiều cao có thật sự cần thiết cho con?

Các diễn viên, MC quảng cáo đã khẳng định như "đinh đóng cột" là con họ và những người quen biết sử dụng sữa này đã giúp tăng chiều cao 3-5cm sau 3 tháng? Không có chuyện ấy đâu. ...

Các luật, nghị quyết thông qua tại Kỳ họp bất thường lần thứ 9 phục vụ hiệu quả cho công cuộc sắp xếp bộ...

Tại Hội nghị toàn quốc quán triệt, triển khai thực hiện Nghị quyết Hội nghị lần thứ 11 Ban Chấp hành Trung ương Đảng khóa XIII diễn ra vào sáng nay (16/4), Ủy viên Bộ Chính trị, Chủ tịch Quốc hội Trần Thanh Mẫn đã truyền đạt...

Mới nhất