Thử nghiệm sớm GPT-5: Không bằng bước nhảy vọt từ GPT-3 lên GPT-4

14 giờ trướcBài gốc

GPT-5 phiên bản mới nhất của mô hình ngôn ngữ lớn làm nền tảng cho hiện tượng ChatGPT từ tháng 11.2022.

Hai chuyên gia thử nghiệm sớm GPT-5 đã nói với Reuters rằng họ rất ấn tượng với khả năng lập trình và giải quyết các bài toán khoa học, toán học của GPT-5. Thế nhưng, cả hai cho rằng mức độ cải tiến của GPT-5 so với GPT-4 không lớn bằng bước nhảy vọt từ GPT-3 lên GPT-4. Do đã ký thỏa thuận bảo mật thông tin, hai người này từ chối nêu tên, theo Reuters.

Bước tiến của GPT-4 đạt được nhờ sức mạnh điện toán và dữ liệu tăng lên đáng kể. OpenAI từng kỳ vọng rằng việc mở rộng quy mô theo cách tương tự sẽ tiếp tục tạo ra các mô hình AI ngày càng tốt hơn.

Tuy nhiên, công ty khởi nghiệp AI hàng đầu thế giới đã gặp khó khăn trong việc mở rộng quy mô. Một trong những vấn đề là rào cản dữ liệu mà OpenAI gặp phải. Ilya Sutskever, đồng sáng lập và cựu nhà khoa học trưởng của OpenAI, cho biết năm ngoái rằng trong khi sức mạnh xử lý đang tăng lên, lượng dữ liệu không tăng tương ứng.

Ông đề cập đến thực tế rằng mô hình ngôn ngữ lớn được huấn luyện trên các tập dữ liệu khổng lồ thu thập từ toàn bộ internet. Các phòng thí nghiệm AI hiện không còn nhiều lựa chọn khác cho kho dữ liệu văn bản do con người tạo ra.

Ngoài việc thiếu dữ liệu, một vấn đề khác là quá trình đào tạo các mô hình ngôn ngữ lớn có nhiều khả năng gặp phải lỗi do phần cứng gây ra vì hệ thống rất phức tạp. Các nhà nghiên cứu có thể không biết hiệu suất cuối cùng của mô hình ngôn ngữ lớn cho đến khi quá trình này kết thúc (có thể mất hàng tháng).

OpenAI chưa công bố thời điểm phát hành GPT-5, nhưng theo các báo cáo truyền thông, giới công nghệ kỳ vọng điều này sẽ xảy ra sớm, có thể trong tháng 8 này. Boris Power, người đứng đầu bộ phận Nghiên cứu ứng dụng tại OpenAI, viết trên mạng xã hội X hôm 6.8: “Rất háo hức chờ xem công chúng sẽ đón nhận GPT-5 như thế nào”.

“OpenAI đã tạo nên một bước tiến khổng lồ từ GPT-3 lên GPT-4, thế nên sự mong đợi dành cho GPT-5 là vô cùng lớn. Hy vọng GPT-5 sẽ mở khóa các ứng dụng AI vượt xa khả năng trò chuyện, tiến tới thực hiện các nhiệm vụ một cách hoàn toàn tự động”, Navin Chaddha, Giám đốc điều hành tại quỹ đầu tư mạo hiểm Mayfield nhận xét.

Mayfield đầu tư vào các công ty AI nhưng không có OpenAI.

Hai chuyên gia cho rằng mức độ cải tiến của GPT-5 so với GPT-4 không lớn bằng bước nhảy vọt từ GPT-3 lên GPT-4 - Ảnh: Internet

Tính toán lúc kiểm thử

Cách đây gần ba năm, ChatGPT đã giới thiệu cho thế giới khái niệm về AI tạo sinh, khiến người dùng kinh ngạc với khả năng viết văn và thơ giống con người, và nhanh chóng trở thành một trong những ứng dụng phát triển nhanh nhất lịch sử.

Vào tháng 3.2023, OpenAI đã phát hành GPT-4, mô hình ngôn ngữ lớn có bước tiến vượt bậc về trí tuệ. Trong khi phiên bản trước đó là GPT-3.5 chỉ đạt điểm kỳ thi luật ở nhóm 10% thấp nhất, GPT-4 đã vượt qua kỳ thi mô phỏng này với kết quả thuộc top 10% cao nhất.

GPT-4 sau đó đã trở thành mô hình ngôn ngữ lớn tiêu chuẩn để đánh giá. Thế giới bắt đầu nhận ra rằng các mô hình AI có thể vượt trội hơn con người trong nhiều nhiệm vụ.

Không lâu sau, các công ty khác cũng bắt đầu bắt kịp OpenAI. Trong cùng năm 2023, Google của Alphabet và Anthropic (được Amazon, Google hậu thuẫn) đã tung ra những mô hình cạnh tranh với GPT-4. Chỉ trong vòng một năm, các mô hình ngôn ngữ lớn mã nguồn mở hiệu suất ngang với GPT-4 như Llama 3 của Meta Platforms cũng được phát hành.

Ngoài việc huấn luyện các mô hình ngôn ngữ lớn, OpenAI hiện đã đầu tư vào một hướng đi khác gọi là “tính toán lúc kiểm thử”, cho phép dồn nhiều sức mạnh xử lý hơn để giải quyết những nhiệm vụ khó như toán học hoặc tác vụ phức tạp đòi hỏi khả năng suy luận và ra quyết định giống con người.

Sam Altman, Giám đốc điều hành OpenAI, cho biết GPT-5 sẽ kết hợp cả hai yếu tố: Tính toán lúc kiểm thử và các mô hình ngôn ngữ lớn.

Tính toán lúc kiểm thử là đề cập đến việc sử dụng thêm sức mạnh điện toán để cải thiện hiệu suất của mô hình AI sau khi nó đã được huấn luyện xong.

Thay vì chỉ dựa vào kiến thức đã học trong quá trình huấn luyện, tính toán lúc kiểm thử cho phép mô hình dành thêm thời gian và tài nguyên để "suy nghĩ" khi xử lý một yêu cầu. Điều này giúp mô hình giải quyết các vấn đề phức tạp, đòi hỏi nhiều bước tư duy logic, tốt hơn.

Dưới đây là một số điểm chính về tính toán lúc kiểm thử:

Cách thức hoạt động

Tư duy giống con người: Mô hình sẽ không đưa ra câu trả lời ngay lập tức, mà thay vào đó sẽ thực hiện quá trình tư duy để tìm ra giải pháp tốt nhất. Nó có thể tạo ra nhiều câu trả lời tiềm năng, sau đó tự đánh giá và chọn ra câu trả lời chính xác nhất.

Phân bổ tài nguyên linh hoạt: Mô hình có thể tự đánh giá độ phức tạp của một yêu cầu. Nếu câu hỏi đơn giản, nó sẽ phản hồi nhanh chóng. Nếu câu hỏi khó, mô hình sẽ tự động phân bổ thêm tài nguyên điện toán để xử lý chi tiết hơn.

Cải thiện liên tục: Kỹ thuật này có thể bao gồm việc lặp đi lặp lại để tinh chỉnh câu trả lời, sử dụng các mô hình đánh giá khác để kiểm tra tính chính xác của từng bước tư duy, hoặc áp dụng thuật toán tìm kiếm phức tạp hơn để khám phá không gian giải pháp.

Ưu điểm nổi bật

Tăng hiệu suất: Tính toán lúc kiểm thử giúp cải thiện đáng kể độ chính xác của mô hình trên các tác vụ khó như toán học, lập trình hoặc các bài kiểm tra đòi hỏi suy luận sâu, mà không cần phải huấn luyện lại toàn bộ mô hình từ đầu.

Tiết kiệm chi phí: Thay vì phải liên tục huấn luyện các mô hình ngày càng lớn, tốn kém, phương pháp này giúp các mô hình nhỏ hơn thông minh hơn bằng cách sử dụng tài nguyên điện toán hiệu quả hơn khi cần.

Linh hoạt hơn: Nó phá vỡ quan điểm truyền thống rằng "mô hình càng lớn càng tốt", mở ra một hướng đi mới cho việc phát triển AI, nơi các mô hình có thể thích ứng và tự cải thiện trong quá trình hoạt động.

Trong một tập mới đây của podcast This Past Weekend with Theo Von, Sam Altman mô tả trải nghiệm thử nghiệm GPT-5 với giọng điệu căng thẳng.

Sam Altman nói rằng GPT-5 “hoạt động rất nhanh” khi kể lại những khoảnh khắc khiến ông cảm thấy rất lo sợ. Dù thúc đẩy việc phát triển GPT-5, doanh nhân 40 tuổi người Mỹ tuyên bố rằng trong một số phiên thử nghiệm, ông đã nhìn vào GPT-5 và so sánh mô hình AI thế hệ mới này với dự án Manhattan.

Manhattan là dự án nghiên cứu và phát triển tuyệt mật được Mỹ tiến hành trong Thế chiến II, với sự hỗ trợ của Anh và Canada. Mục tiêu chính của dự án là chế tạo bom nguyên tử đầu tiên trước khi Đức Quốc xã có thể kịp phát triển loại vũ khí này.

Dự án kéo dài từ năm 1942 đến 1946, quy tụ hàng ngàn nhà khoa học, kỹ sư và công nhân tại hơn 30 địa điểm khác nhau trên khắp Mỹ, Anh và Canada. Đây là một nỗ lực khoa học và công nghiệp khổng lồ, đòi hỏi sự phối hợp chặt chẽ giữa quân đội, khoa học và công nghiệp.

Các thông tin cần biết về dự án Manhattan

- Bắt đầu khoảng năm 1939-1942, sau khi các nhà khoa học, trong đó có Albert Einstein và Leo Szilard, cảnh báo chính phủ Mỹ về nguy cơ Đức Quốc xã có thể chế tạo bom nguyên tử.

- Địa điểm chính là thành phố Los Alamos (bang New Mexico), Oak Ridge (bang Tennessee), Hanford (bang Washington) - những trung tâm nghiên cứu và sản xuất nhiên liệu hạt nhân ở Mỹ.

- Người đứng đầu về khoa học của dự án là nhà vật lý J. Robert Oppenheimer, thường được gọi là “cha đẻ của bom nguyên tử”.

- Dự án đã thành công khi cho nổ thử quả bom nguyên tử đầu tiên trong lịch sử vào ngày 16.7.1945 (vụ thử Trinity ở bang New Mexico).

- Hai quả bom nguyên tử từng được thả xuống thành phố Hiroshima và Nagasaki (Nhật Bản) vào tháng 8.1945 khiến hơn 210.000 người chết chỉ trong năm đó và gây ra những ảnh hưởng lâu dài về sức khỏe lẫn và môi trường. Nhiều người khác chết sau đó vì di chứng phóng xạ và ung thư.

Hai vụ ném bom nguyên tử này là yếu tố quyết định thúc đẩy Nhật Bản đầu hàng trong Thế chiến II và chấm dứt chiến tranh.Ý nghĩa

Dự án Manhattan là biểu tượng cho sự đột phá công nghệ vượt bậc, nhưng cũng mở ra kỷ nguyên khí hạt nhân. Dự án Manhattan thường được dùng như một phép ẩn dụ cho những tiến bộ khoa học vừa đầy hứa hẹn, vừa ẩn chứa hiểm họa khó lường, như trong cách Sam Altman nói về GPT-5.

Những cải tiến được mong chờ ở GPT‑5

1. Suy luận có cấu trúc

GPT‑5 có thể được thiết kế để xử lý vấn đề logic phức tạp và các bước quyết định liên tiếp hiệu quả hơn rất nhiều so với GPT‑4 và GPT‑4o.

2. Khả năng đa phương thức thống nhất

Người dùng không còn phải chuyển đổi giữa các phiên bản mô hình ngôn ngữ lớn chuyên biệt để sử dụng theo nhu cầu, vì GPT‑5 tích hợp xử lý văn bản, hình ảnh, giọng nói và logic trong một hệ thống duy nhất.

3. Cửa sổ ngữ cảnh dài hơn và phản hồi chính xác hơn

Rộ tin GPT‑5 hỗ trợ cửa sổ ngữ cảnh rất lớn (có thể tới hàng triệu token), ghi nhớ cuộc trò chuyện dài và ít sai lệch nội dung, giảm hiện tượng ảo giác (đưa ra thông tin sai lệch giống như thật).

Cửa sổ ngữ cảnh là chỉ lượng thông tin mà mô hình ngôn ngữ lớn có thể ghi nhớ hoặc xử lý cùng lúc trong một đoạn văn bản.

4. Khả năng lập trình và giải toán được nâng cao

Hiệu suất trong các tác vụ liên quan đến lập trình, toán học và logic của GPT-5 được cho sẽ cải thiện đáng kể, vượt trội các đối thủ như Claude Sonnet 4 do Anthropic phát triển.

5. Dễ tùy biến và thân thiện với người dùng

Dự kiến GPT-5 sẽ có phiên bản mini và nano nhằm vận hành nhẹ hơn và tương thích API, phù hợp cả cho người dùng phổ thông và nhà phát triển, với giao diện tiện lợi và mang đến trải nghiệm mượt mà hơn.

6. Tăng cường an toàn và kiểm soát đạo đức

OpenAI có thể chú trọng đến việc thử nghiệm, kiểm soát đạo đức và xác minh sự an toàn của GPT‑5 trước khi ra mắt, nhằm giảm thiểu rủi ro khi sử dụng trong các vấn đề nhạy cảm như an ninh sinh học.

Sơn Vân

Nguồn Một Thế Giới : https://1thegioi.vn/thu-nghiem-som-gpt-5-khong-bang-buoc-nhay-vot-tu-gpt-3-len-gpt-4-235863.html