+1

So sánh GPT-5.4 Mini và Nano: Benchmark, giá và khi nào nên dùng mô hình nào

GPT-5.4 mini và GPT-5.4 nano là hai mô hình nhỏ mới nhất của OpenAI, được tối ưu cho tốc độ và chi phí thay vì hiệu suất tối đa. GPT-5.4 mini nhanh gấp đôi so với GPT-5 mini với cải thiện đáng kể trên benchmark, còn GPT-5.4 nano là lựa chọn nhỏ và rẻ nhất trong dòng GPT-5.4, giá chỉ 0.20 USD/1M input token, thấp hơn cả Claude Haiku 4.5 của Anthropic.

Tóm tắt các điểm chính

  • GPT-5.4 mini thay thế GPT-5 mini, nhanh gấp đôi, đạt 54.4% trên SWE-Bench Pro và 72.1% trên OSWorld-Verified, giá 0.75 USD/1M input và 4.50 USD/1M output token.
  • GPT-5.4 nano chỉ có trên API, đạt 52.4% SWE-Bench Pro và 39% OSWorld-Verified, giá 0.20 USD/1M input và 1.25 USD/1M output token, rẻ hơn Claude Haiku 4.5 trên cả hai chiều.
  • Cả hai hỗ trợ context window 400K token, image input, tool use, function calling và structured output.
  • Thứ tự benchmark nhất quán qua gần như toàn bộ bài kiểm tra: GPT-5.4 dẫn đầu, tiếp theo là mini, nano, rồi GPT-5 mini.
  • GPT-5.4 mini phù hợp làm mô hình mặc định cho production app cần chất lượng tốt ở khối lượng lớn; GPT-5.4 nano phù hợp cho sub-agent và tác vụ mass workload cực kỳ nhạy cảm với latency.

GPT-5.4 mini là gì và khác gì GPT-5 mini?

GPT-5.4 mini là LLM nhỏ mới nhất của OpenAI, thay thế trực tiếp GPT-5 mini với hai cải tiến chính: nhanh gấp đôi và hiệu suất tốt hơn đáng kể trên benchmark. Đây không đơn thuần là bản cập nhật tên gọi mà là bước nhảy thực chất, đặc biệt trên SWE-Bench Pro nơi GPT-5.4 mini đạt 54.4% so với 45.7% của GPT-5 mini.

Về tính năng, GPT-5.4 mini hỗ trợ đầy đủ trong API: text và image input, tool use, function calling, web search, computer use và skills. Context window là 400K token, ngang bằng với GPT-5.4 flagship. GPT-5.4 mini hiện có sẵn trên ChatGPT browser UI, Codex và API. Trong ChatGPT, nó là mô hình Thinking mặc định cho người dùng Free và Go tier, đồng thời là mô hình dự phòng cho tất cả người dùng đã hết giới hạn GPT-5.4 Thinking.

GPT-5.4 nano là gì và dùng cho mục đích gì?

GPT-5.4 nano là phiên bản nhỏ và hiệu quả nhất trong dòng GPT-5.4, thay thế GPT-5 nano. Nano nhỏ hơn và rẻ hơn mini nhưng vẫn vượt qua GPT-5 mini trên nhiều benchmark — một tín hiệu rõ ràng về tốc độ phát triển của ngành khi mô hình năm ngoái trở thành tiêu chuẩn tầm trung của năm nay.

GPT-5.4 nano chỉ có trên API, không phải trong ChatGPT. Nó hỗ trợ image input, tool use, function calling và structured output nhưng thiếu một số tính năng nâng cao so với mini. Giá 0.20 USD/1M input token và 1.25 USD/1M output token đặt nano vào phân khúc ultra-efficient cho khối lượng request cực lớn, đặc biệt phù hợp với kiến trúc sub-agent nơi mô hình lớn hơn giao các tác vụ đơn giản xuống cho nano xử lý song song.

GPT-5.4 mini và nano đạt kết quả ra sao trên benchmark?

Kết quả benchmark của bốn mô hình GPT-5.4 (từ flagship đến nano và GPT-5 mini cũ) cho thấy thứ tự nhất quán qua gần như tất cả bài kiểm tra:

Benchmark GPT-5.4 GPT-5.4 mini GPT-5.4 nano GPT-5 mini
SWE-Bench Pro (Public) 57.7% 54.4% 52.4% 45.7%
Terminal-Bench 2.0 75.0% 60.0% 46.3% Không có
OSWorld-Verified 75.0% 72.1% 39.0% Không có
GPQA Diamond Cao nhất Cao hơn nano Tham chiếu Thấp hơn nano

Về lập trình, cả mini (54.4%) và nano (52.4%) đều vượt ngưỡng 50% trên SWE-Bench Pro, không tụt hậu quá xa so với flagship (57.7%), và đều cải thiện đáng kể so với GPT-5 mini (45.7%).

Về terminal agent, khoảng cách giữa ba phiên bản GPT-5.4 mới thấy rõ nhất: mini (60.0%) cạnh tranh được với flagship GPT-5.2 cũ (62.2%), nhưng nano (46.3%) chỉ ngang GPT-5 cũ (49.6%). Terminal-Bench 2.0 rõ ràng không phải sân chơi của nano.

Về computer use, GPT-5.4 mini đạt 72.1% trên OSWorld-Verified, bám sát flagship. GPT-5.4 nano chỉ đạt 39.0% và rõ ràng không được thiết kế cho tác vụ computer use.

GPT-5.4 mini và nano có giá bao nhiêu so với các mô hình cạnh tranh?

Bảng giá của hai mô hình mới so với GPT-5.4 flagship và Claude Haiku 4.5:

Mô hình Giá input/1M token Giá output/1M token Context window
GPT-5.4 2.50 USD 15 USD 272K (chuẩn)
GPT-5.4 mini 0.75 USD 4.50 USD 400K
GPT-5.4 nano 0.20 USD 1.25 USD 400K
Claude Haiku 4.5 1 USD 5 USD Không công bố

GPT-5.4 nano đang undercut Claude Haiku 4.5 của Anthropic trên cả hai chiều: input rẻ hơn 5 lần (0.20 USD so với 1 USD) và output rẻ hơn 4 lần (1.25 USD so với 5 USD). Đây là áp lực định giá đáng kể lên phân khúc small model.

GPT-5.4 nano so với Claude Haiku 4.5 có gì khác biệt?

Việc so sánh GPT-5.4 nano với Claude Haiku 4.5 phức tạp hơn vì hai mô hình được đánh giá trên các phiên bản benchmark khác nhau. Về lập trình, Claude Haiku 4.5 được kiểm thử trên SWE-Bench Verified và đạt 73.3%, còn GPT-5.4 nano được kiểm thử trên SWE-Bench Pro và đạt 52.4%. SWE-Bench Pro là bài kiểm tra khó hơn và ít bão hòa hơn, do đó điểm thấp hơn không có nghĩa là mô hình yếu hơn trực tiếp.

Claude Haiku 4.5

Trên hai bài kiểm tra có thể so sánh trực tiếp nhất, GPT-5.4 nano dẫn đầu: GPQA Diamond cao hơn Claude Haiku 4.5 khoảng 9.8 điểm phần trăm, và τ2-bench Telecom cao hơn 9.5 điểm phần trăm.

Về computer use, Claude Haiku 4.5 đạt 50.7% trên OSWorld tiêu chuẩn, còn GPT-5.4 nano đạt 39.0% trên OSWorld-Verified, phiên bản khó hơn. Khoảng cách gần 12 điểm phần trăm không thể bác bỏ hoàn toàn do sự khác biệt benchmark, và Infinity News đánh giá thận trọng là Claude Haiku 4.5 có thể có lợi thế thực sự trong computer use so với nano.

Điểm GPT-5.4 nano đạt 39%, được OSWorld xác minh Điểm GPT-5.4 nano đạt 39%, được OSWorld xác minh

Khi nào nên dùng GPT-5.4 mini, khi nào nên dùng nano?

GPT-5.4 mini phù hợp nhất làm mô hình mặc định cho production app cần chất lượng tốt ở khối lượng cao. Mini đủ mạnh để cảm nhận như frontier trong hầu hết tác vụ thực tế trong khi rẻ và nhanh đủ cho high-volume use. Điểm 72.1% trên OSWorld-Verified và 60.0% trên Terminal-Bench 2.0 cho thấy mini có thể xử lý cả tác vụ computer use và terminal agent ở mức chấp nhận được, không chỉ tác vụ text thông thường.

GPT-5.4 nano là lựa chọn chuyên biệt cho hai nhóm use case: tác vụ real-time khối lượng cực lớn với yêu cầu latency nghiêm ngặt, và sub-agent trong kiến trúc multi-agent nơi mô hình lớn hơn giao các tác vụ đơn giản xuống cho nano xử lý song song. Với giá 0.20 USD/1M input token, nano là lựa chọn kinh tế nhất cho classification, data extraction và routing đơn giản khi throughput quan trọng hơn chất lượng.

GPT-5.4 flagship vẫn là lựa chọn ưu tiên cho tác vụ đòi hỏi lý luận nặng, ít dung sai sai sót, multimodality đầy đủ và agentic workflow phức tạp.

Kết luận

GPT-5.4 mini và GPT-5.4 nano lấp đầy hai vị trí rõ ràng trong hệ sinh thái model của OpenAI năm 2026. Mini là mô hình production hàng ngày cho phần lớn developer, nhanh gấp đôi GPT-5 mini với chất lượng cải thiện đáng kể và giá 0.75 USD/1M input. Nano là công cụ chuyên biệt cho latency cực thấp và sub-agent kinh tế với giá 0.20 USD/1M input, thấp hơn Claude Haiku 4.5 ở cả hai chiều.

Điều đáng chú ý nhất không phải là tính năng cụ thể của hai mô hình này mà là pattern chúng phản ánh: hiệu suất của GPT-5.4 flagship năm nay đang trở thành tiêu chuẩn của mô hình phổ thông tương lai. Thiết kế hệ thống có khả năng hoán đổi mô hình dễ dàng, thay vì tối ưu hóa cho một phiên bản cụ thể, là chiến lược bền vững hơn trong môi trường thay đổi với tốc độ này.


Nguồn: Infinity News


All rights reserved

Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí