icon cat upload

ChatGPT-4o mới ra mắt có gì nổi bật so với các phiên bản khác?

Đào Thủy Tiên
icon calendar
19/05/2024 15:08
icon comment 0

Mới đây, Công ty trí tuệ nhân tạo hàng đầu thế giới OpenAI vừa tổ chức sự kiện công bố mô hình AI mới có tên GPT-4o với nhiều tính năng mới thu hút người dùng.

ChatGPT-4o là gì?

ChatGPT là một mô hình trí tuệ nhân tạo được phát triển bởi OpenAI, dựa trên kiến trúc GPT (Generative Pre-trained Transformer). ChatGPT được huấn luyện trên một lượng lớn data từ Internet có khả năng hiểu và tạo ra văn bản, hình ảnh tự nhiên.

Các phiên bản ChatGPT cho tới thời điểm hiện tại:

  • ChatGPT-1: Ra mắt vào năm 2018, đây là phiên bản đầu tiên có 117 triệu tham số. Đây cũng là bản đặt nền móng cho việc sử dụng mô hình  Transformer trong xử lý ngôn ngữ tự nhiên.

  • ChatGPT-2: Ra mắt vào năm 2019 với 1,5 tỷ tham số, ChatGPT-2 có khả năng tạo ra văn bản mạch lạc cũng như viết văn bản dài.

  • ChatGPT-3: Phiên bản này được phát hành vào năm 2020 với 175 tỷ tham số. Đây được xem là một bước nhảy vọt về khả năng hiểu và tạo ra ngôn ngữ. ChatGPT-3 còn được cải thiện về độ chính xác và tính tự nhiên của các phản hồi.

  • ChatGPT-4: Phát hành vào năm 2023, phiên bản này gây ấn tượng với khả năng xử lý ngôn ngữ, tăng độ chính xác, mạch lạc và tính an toàn của các phản hồi. ChatGPT-4 hỗ trợ đa ngôn ngữ và có khả năng tùy chỉnh cao hơn cho các ứng dụng cụ thể.

  • ChatGPT-4o: Đây là phiên bản mới nhất được Open AI phát hành vào ngày 13/05/2024. Trong đó, chữ “o” trong ChatGPT-4o là chữ viết tắt của “omini” (toàn năng). GPT-4o có thể chấp nhận đầu vào bất kỳ sự kết hợp nào giữa văn bản, âm thanh và hình ảnh.

Hiện tại, Open AI cung cấp cho người dùng trải nghiệm free đối với phiên bản Chat GPT-4o. Tuy nhiên, bản free sẽ bị giới hạn số lượng câu hỏi trong một khoảng thời gian nhất định.

Trong khi đó, Google cũng đã có sự đáp trả tại hội nghị Google I/O 2024 hứa hẹn sẽ có những bản cập nhật lớn cho Google Gemini để đối đầu trực tiếp với ChatGPT.

Khả năng của ChatGPT-4o

Trước khi có ChatGPT-4o, bạn có thể sử dụng Voice Mode để trò chuyện với ChatGPT. Độ trễ trung bình khi sử dụng Voice Mode là khoảng 2,8 giây với GPT-3.5 và 5,4 giây với GPT-4.

Để làm được điều này, Voice Mode có cách thức hoạt động như sau: Một mô hình đơn giản chuyển đổi âm thành thành văn bản. GPT-3.5 hoặc GPT-4 nhận văn bản, xử lý và tạo ra văn bản phản hồi. Lúc này, một mô hình đơn giản thứ ba sẽ chuyển đổi văn bản đó thành âm thanh.

Đặc biệt, Sam Altman- Giám đốc điều hành OpenAI tiết lộ GPT-4o có tính chất đa phương thức- có thể tạo ra nội dung hoặc hiểu các lệnh bằng giọng nói, văn bản hoặc hình ảnh. Mô hình AI mới có thể tương tác bằng văn bản và thị giác – nó có thể xem các ảnh, tài liệu hoặc biểu đồ do người dùng tải lên và thảo luận về chúng.

Các giám đốc điều hành của Open AI đã trình diễn một cuộc trò chuyện bằng giọng nói với ChatGPT để nhận hướng dẫn theo thời gian thực về việc giải toán, kể chuyện trước khi đi ngủ và nhận lời khuyên về lập trình.

chatgpt 4o la gi 5 jpg
ChatGPT-4o có thể nhận diện sắc thái trong giọng nói và nhiều người nói cùng lúc

Tuy nhiên, quá trình chuyển đổi âm thanh thành văn bản và văn bản thành âm thanh còn có nhiều hạn chế. GPT-4 có thể mất một số thông tin như tông điệu giọng nói, nhiều người nói, tiếng ồn nền tiếng cười hay biểu đạt cảm xúc.

ChatGPT-4o là một phiên bản mới của ChatGPT hứa hẹn sẽ khắc phục những hạn chế của các phiên bản trước đó. ChatGPT-4o được huấn luyện trên một tập dữ liệu khổng lồ bao gồm văn bản, hình ảnh và âm thanh. Nó sử dụng một mạng neural duy nhất để xử lý tất cả các thông tin đầu vào và đầu ra.

GPT-4o có tính năng gì nổi bật?

Nhanh hơn và mượt mà hơn

Nếu bạn thấy nhược điểm lớn nhất của GPT-4 là tốc độ, hãy yên tâm rằng vấn đề đó đã được khắc phục trên ChatGPT-4o. GPT-4o nhanh hơn đáng kể so với GPT-4 thông thường, thậm chí nhanh gấp đôi GPT-4 Turbo.

Cụ thể, trong bản demo, GPT-4o đã tạo ra câu trả lời 488 từ trong vòng chưa đầy 12 giây. Một câu lệnh tương tự có thể sẽ mất gần một phút nếu dùng GPT-4.

So với người tiền nhiệm GPT-4 Turbo, GPT-4o không chỉ duy trì hiệu suất ấn tượng trong xử lý văn bản tiếng Anh và lập trình, mà còn vượt trội hơn hẳn khi xử lý các ngôn ngữ khác. Nhờ vậy, người dùng sẽ được tận hưởng trải nghiệm mượt mà và trơn tru hơn.

Trải nghiệm thực tế cho thấy tốc độ phản hồi của Chat GPT-4o nhanh hơn đáng kể so với Google Gemini hay Microsoft Copilot. Điều này giúp người dùng tiết kiệm thời gian và nâng cao hiệu quả công việc.

Khả năng dịch song ngữ ngay tức thì

ChatGPT-4o có khả năng trò chuyện tự nhiên đến mức có thể bắt chước các đặc điểm của người thật như ngắt lời, nghe – hiểu, tông giọng. Bên cạnh đó, nó còn có thể dịch song ngữ với tốc độ nhanh chóng. Trong một bản demo khác, khi một người nói tiếng Anh và một người nói tiếng Italy có một cuộc trò chuyện với bằng GPT-4o. Nó đã cung cấp bản dịch từ tiếng Italy sang tiếng Anh và sau đó dịch từ tiếng Anh trở lại tiếng Italy một cách nhanh chóng và liền mạch.

photo 1715745361934 17157453624481471921258 1715919995927 1715919996017679148389
ChatGPT-4o mới ra mắt có gì nổi bật so với các phiên bản khác?

Hiểu và biểu đạt cảm xúc 

GPT-4o không dừng lại ở văn bản mà còn mở rộng khả năng sang lĩnh vực âm thanh và hình ảnh. Bạn có thể giao tiếp với máy tính bằng giọng nói, không chỉ đơn giản là nhận diện từ ngữ mà còn hiểu được ngữ điệu và ngữ cảnh.

Bên cạnh đó, GPT-4o cũng có thể nhìn – hiểu hình ảnh. Ví dụ, chatbot nhìn vào một bức ảnh selfie và viết phần mô tả liên quan đến trang phục bạn đang mặc hay cảm xúc của bạn lúc đó.

ChatGPT-4o còn có khả năng phản hồi các câu hỏi bằng giọng nói chỉ trong 232ms, tương đương với tốc độ phản hồi của con người trong cuộc trò chuyện. Điều này mang đến trải nghiệm trò chuyện với GPT-4o diễn ra tự nhiên và sống động hơn.

Xử lý liền mạch hơn

So với các phiên bản Voice Mode trước đây, ChatGPT-4o mang đến một bước tiến vượt bậc trong việc đơn giản hóa và nâng cao trải nghiệm tương tác bằng giọng nói.

Thay vì sử dụng nhiều mô hình riêng biệt cho từng nhiệm vụ (chuyển đổi giọng nói thành văn bản, xử lý văn bản, chuyển văn bản thành giọng nói), GPT-4o sử dụng một mô hình duy nhất để xử lý toàn bộ quá trình từ đầu đến cuối. Nhờ vậy, thời gian phản hồi được rút ngắn đáng kể, đồng thời chất lượng tương tác cũng được cải thiện rõ rệt.

ChatGPT-4o mới sở hữu khả năng nhận diện các sắc thái trong giọng nói, nhận diện nhiều người nói cùng lúc, thậm chí có thể tích hợp âm thanh như tiếng cười hay tiếng hát vào phản hồi của nó.

Tính năng an toàn

Khi phát hành ChatGPT-4o, OpenAI tuyên bố rằng họ đã triển khai các kỹ thuật mới để đảm bảo an toàn cho model outputs trên tất cả các modalities mới. Điều này bao gồm data refined training data và built-in safeguards được thiết kế đặc biệt cho các tương tác bằng giọng nói.

Hướng dẫn sử dụng ChatGPT-4o

Sử dụng ChatGPT-4o trên web

Theo OpenAI, mô hình GPT-4o đã sẵn sàng cho tất cả người dùng ChatGPT, bao gồm cả người dùng không mất phí và người dùng trả phí. Hiện tại, mô hình đang dần được triển khai cho người dùng trả phí và sẽ sớm mở rộng cho người dùng miễn phí trong vài tuần tới. Cách sử dụng đơn giản như sau:

  • Truy cập chatgpt.com và đăng nhập bằng tài khoản của bạn.

  • Nhấp vào Menu thả xuống ở góc trên bên trái, sau đó chọn GPT-4o.

  • Bắt đầu trải nghiệm ChatGPT-4o.

Sử dụng ChatGPT-4o trên Android và iOS

Người dùng ChatGPT Plus có quyền truy cập vào mô hình GPT-4o trên Android và iOS. Bên cạnh đó, người dùng ChatGPT miễn phí cũng có quyền truy cập trong những tuần tới.

  • Cài đặt ứng dụng ChatGPT trên thiết bị di động của bạn (Android / iOS)

  • Đăng nhập vào tài khoản.

  • Chọn GPT-4o từ menu 3 chấm ở góc trên bên phải và trải nghiệm.

Hãy cùng https://smartf.vn/ khám phá những tính năng mới nhất của ChatGPT-4o bạn nhé!

Khám phá smartf.vn - Cộng đồng tài chính thông minh hàng đầu. Tại đây, bạn sẽ cập nhật tin tức tài chính mới nhất từ các chuyên gia hàng đầu. Tận hưởng kiến thức chuyên sâu, phân tích sắc sảo về thị trường tài chính, chứng khoán, bất động sản. Đừng bỏ lỡ cơ hội nâng cao kiến thức và ra quyết định đầu tư thông minh. Truy cập smartf.vn, Facebook pageInstagram mỗi ngày.

“Sốt AI” khiến giá chip tăng vọt

Thị trường chip nhớ băng thông cao (HBM) đang chứng kiến sự tăng trưởng bùng nổ do nhu cầu ngày càng tăng về trí tuệ nhân tạo (AI). 

Hoàng Le
icon comment 0

Kỹ năng AI có thể giúp tăng thu nhập hơn 36%

Thay vì lo sợ sẽ bị mất việc bởi AI, 97% người lao động mong muốn tổ chức của họ trở thành công ty vận hành trên nền tảng AI. Hơn 97% người lao động kỳ vọng kỹ năng AI của họ sẽ có các tác động tích cực đến nghề nghiệp, tăng hiệu suất. Nhà tuyển dụng cũng sẵn sàng trả lương cao hơn tới 36% cho người lao động có kỹ năng và kinh nghiệm AI...

Cát Tiên
icon comment 0

AI và bài toán bản quyền

Ngày 8-3, ba nhà văn Brian Keene, Abdi Nazemian và Stewart O'Nan đã khởi kiện Tập đoàn Nvidia vì tự ý sử dụng các tác phẩm của họ để huấn luyện công cụ trí tuệ nhân tạo (AI) NeMo.

Cát Tiên
icon comment 0

3 ngành đặc biệt hưởng lợi từ ChatGPT

Bất kỳ ai cũng có thể yêu cầu công cụ ChatGPT trả lời một câu hỏi hoặc thực hiện một nhiệm vụ nào đó. Nhưng theo Sam Altman, CEO của OpenAI, chatbot phổ biến này đặc biệt hữu dụng cho những người làm việc trong 3 ngành cụ thể, ...

Tuệ Lâm
icon comment 0
Copyright © 2023 SmartF. All right reserved.