26/07/2024 |
Giới thiệu về mô hình nhỏ tiết kiệm chi phí nhất của OpenAI
OpenAI cam kết mang trí tuệ nhân tạo đến mọi người một cách rộng rãi nhất có thể. Họ kỳ vọng GPT-4o mini sẽ mở rộng phạm vi ứng dụng của AI bằng cách giúp nó trở nên dễ tiếp cận hơn. GPT-4o mini đạt 82% trên bảng xếp hạng MMLU và hiện vượt qua GPT-4 về sở thích trò chuyện trên bảng xếp hạng LMSYS. Giá của GPT-4o mini là 15 cent mỗi một triệu token đầu vào và 60 cent mỗi một triệu token đầu ra, rẻ hơn nhiều so với các mô hình tiên tiến trước đây và hơn 60% so với GPT-3.5 Turbo.
GPT-4o mini hỗ trợ một loạt các nhiệm vụ với chi phí và độ trễ thấp, chẳng hạn như các ứng dụng xâu chuỗi hoặc chạy song song nhiều lần gọi mô hình (ví dụ, gọi nhiều API), truyền một lượng lớn ngữ cảnh vào mô hình (ví dụ, toàn bộ mã nguồn hoặc lịch sử trò chuyện), hoặc tương tác với khách hàng thông qua phản hồi văn bản nhanh, thời gian thực (ví dụ, chatbot hỗ trợ khách hàng).
Hôm nay, GPT-4o mini hỗ trợ văn bản và hình ảnh trong API, với hỗ trợ cho văn bản, hình ảnh, video và âm thanh đầu vào và đầu ra sẽ ra mắt trong tương lai. Mô hình có cửa sổ ngữ cảnh là 128K token, hỗ trợ tới 16K token đầu ra mỗi lần yêu cầu, và có kiến thức tới tháng 10 năm 2023. Nhờ bộ mã hóa cải tiến được chia sẻ với GPT-4o, việc xử lý văn bản không phải tiếng Anh nay càng tiết kiệm chi phí hơn.
Một mô hình nhỏ với trí tuệ văn bản và lý luận đa phương tiện vượt trội
GPT-4o mini vượt trội hơn GPT-3.5 Turbo và các mô hình nhỏ khác trong các bài kiểm tra học thuật về trí tuệ văn bản và lý luận đa phương tiện, và hỗ trợ cùng một phạm vi ngôn ngữ như GPT-4o. Nó cũng thể hiện hiệu suất mạnh mẽ trong việc gọi hàm, giúp các nhà phát triển xây dựng các ứng dụng lấy dữ liệu hoặc thực hiện hành động với các hệ thống bên ngoài, và cải thiện hiệu suất ngữ cảnh dài so với GPT-3.5 Turbo.
GPT-4o mini đã được đánh giá qua một số bài kiểm tra quan trọng.
Nhiệm vụ lý luận: GPT-4o mini vượt trội hơn các mô hình nhỏ khác trong các nhiệm vụ lý luận liên quan đến cả văn bản và hình ảnh, đạt 82.0% trên bảng xếp hạng MMLU, một bài kiểm tra trí tuệ văn bản và lý luận, so với 77.9% của Gemini Flash và 73.8% của Claude Haiku.
Kỹ năng toán học và lập trình: GPT-4o mini xuất sắc trong các nhiệm vụ lý luận toán học và lập trình, vượt qua các mô hình nhỏ trước đó trên thị trường. Trên MGSM, đo lường lý luận toán học, GPT-4o mini đạt 87.0%, so với 75.5% của Gemini Flash và 71.7% của Claude Haiku. GPT-4o mini đạt 87.2% trên HumanEval, đo lường hiệu suất lập trình, so với 71.5% của Gemini Flash và 75.9% của Claude Haiku.
Lý luận đa phương tiện: GPT-4o mini cũng thể hiện hiệu suất mạnh mẽ trên MMMU, một bài kiểm tra lý luận đa phương tiện, đạt 59.4% so với 56.1% của Gemini Flash và 50.2% của Claude Haiku.
Đánh giá mô hình
Trong quá trình phát triển mô hình, OpenAI đã hợp tác với một số đối tác tin cậy để hiểu rõ hơn về các trường hợp sử dụng và hạn chế của GPT-4o mini như Ramp và Superhuman, những người nhận thấy GPT-4o mini hoạt động tốt hơn đáng kể so với GPT-3.5 Turbo trong các nhiệm vụ như trích xuất dữ liệu có cấu trúc từ các tệp biên lai hoặc tạo ra phản hồi email chất lượng cao khi được cung cấp lịch sử chuỗi.
Biện pháp tích hợp an toàn
An toàn được tích hợp vào mô hình của GPT-4o mini ngay từ đầu và được củng cố ở mỗi bước của quá trình phát triển. Trong quá trình tiền huấn luyện, OpenAI lọc bỏ thông tin không mong muốn mô hình học hoặc xuất ra, như lời nói căm thù, nội dung người lớn, các trang web chủ yếu tổng hợp thông tin cá nhân và spam. Trong quá trình huấn luyện sau, OpenAI điều chỉnh hành vi của mô hình theo các chính sách của mình bằng cách sử dụng các kỹ thuật như học tăng cường với phản hồi của con người (RLHF) để cải thiện độ chính xác và độ tin cậy của các phản hồi của mô hình.
GPT-4o mini có cùng các biện pháp giảm thiểu an toàn như GPT-4o, đã được OpenAI đánh giá cẩn thận bằng cả đánh giá tự động và con người theo Khung hành lang pháp lý của công ty. Hơn 70 chuyên gia bên ngoài trong các lĩnh vực như tâm lý học xã hội và thông tin sai lệch đã thử nghiệm GPT-4o để xác định các rủi ro tiềm ẩn đã giải quyết và dự định chia sẻ chi tiết trong thẻ hệ thống GPT-4o và thẻ điểm sẵn sàng sắp tới. Những hiểu biết từ các đánh giá của chuyên gia này đã giúp cải thiện độ an toàn của cả GPT-4o và GPT-4o mini.
Dựa trên những bài học này, các nhóm của OpenAI cũng đã làm việc để cải thiện độ an toàn của GPT-4o mini bằng cách sử dụng các kỹ thuật mới. GPT-4o mini trong API là mô hình đầu tiên áp dụng phương pháp phân cấp chỉ dẫn, giúp cải thiện khả năng chống lại các cuộc tấn công jailbreak, chèn lệnh và trích xuất hệ thống lệnh. Điều này làm cho các phản hồi của mô hình trở nên đáng tin cậy hơn và giúp an toàn hơn khi sử dụng trong các ứng dụng quy mô lớn.
OpenAI sẽ tiếp tục theo dõi cách GPT-4o mini được sử dụng và cải thiện độ an toàn của mô hình khi xác định được các rủi ro mới.
Giá cả và tích hợp sẵn
GPT-4o mini hiện có sẵn dưới dạng mô hình văn bản và hình ảnh trong Assistants API, Chat Completions API và Batch API. Các nhà phát triển trả 15 cent cho mỗi 1 triệu token đầu vào và 60 cent cho mỗi 1 triệu token đầu ra (tương đương với khoảng 2500 trang trong một cuốn sách tiêu chuẩn). OpenAI dự định sẽ triển khai tùy chỉnh cho GPT-4o mini trong những ngày tới.
Trong ChatGPT, người dùng miễn phí, Plus và Team sẽ có thể truy cập GPT-4o mini bắt đầu từ hôm nay, thay thế cho GPT-3.5. Người dùng doanh nghiệp cũng sẽ có quyền truy cập bắt đầu từ tuần tới, phù hợp với sứ mệnh của công ty là mang lợi ích của AI đến cho tất cả mọi người.