DeepHermes-3: Mô hình AI cá nhân hóa, suy luận linh hoạt từ Nous Research

DeepHermes-3: Mô Hình AI “Cá Nhân Hóa, Không Giới Hạn” Mới Nhất Từ Nous Research

Ngày 14 tháng 2 năm 2025

Anime girl with black bob tries on headset against backdrop of angel wings

Tín dụng: VentureBeat tạo bằng Midjourney

Các mô hình suy luận AI – những mô hình tạo ra “chuỗi suy nghĩ” (CoT) trong văn bản và phản ánh phân tích của chính chúng để cố gắng bắt lỗi giữa chừng trước khi đưa ra phản hồi – đang trở nên rất phổ biến hiện nay nhờ DeepSeek“o” series của OpenAI.

Vẫn còn khá đáng kinh ngạc đối với tôi về tốc độ mà phương pháp mô hình suy luận đã lan rộng khắp ngành công nghiệp AI, với thông báo trong tuần này rằng có một mô hình mới khác để thử, mô hình này đến từ tập thể kỹ sư Nous Research bí ẩn nhưng đáng khen ngợi, có nhiệm vụ duy nhất kể từ khi ra mắt tại Thành phố New York vào năm 2023 là tạo ra các mô hình AI “cá nhân hóa, không giới hạn” – thường bằng cách lấy và tinh chỉnh hoặc đào tạo lại các mô hình mã nguồn mở như Meta’s Llama series và những mô hình từ startup Pháp Mistral.


Như đã đăng trên tài khoản Nous Research trên X và trong kênh Discord của công ty, mô hình suy luận mở mới này có tên là “DeepHermes-3 Preview” và được mô tả là một “LLM [mô hình ngôn ngữ lớn] thống nhất khả năng suy luận và mô hình ngôn ngữ trực quan”, và cho phép người dùng chuyển đổi tùy ý giữa các quy trình suy luận dài hơn và các phản hồi ngắn hơn, nhanh hơn, ít đòi hỏi tính toán hơn.

Screenshot Nous Research

Ảnh chụp màn hình tài khoản X của Nous Research

Đây là một biến thể 8 tỷ tham số (số lượng cài đặt) của Hermes 3, bản thân nó là một biến thể của Meta’s Llama do Nous phát hành vào tháng 8 năm 2024. Các trao đổi mẫu đã cho thấy rằng nó có thể tham gia vào các màn hình hiển thị siêu nhận thức về việc suy nghĩ về bản thân và vai trò của AI so với ý thức của con người, gây ra một điều gì đó gần giống như một cuộc khủng hoảng hiện sinh trong các đầu ra của mô hình.

Người dùng có thể tải xuống toàn bộ mã mô hình trên HuggingFace và một phiên bản đã được lượng tử hóa (giảm số bit) và lưu trong định dạng thống nhất do GPT tạo ra (GGUF), được thiết kế để chạy các suy luận mô hình (bản dựng sản xuất thực tế, trái ngược với đào tạo) trên PC và máy chủ cấp tiêu dùng.

Hugging Face DeepHermes-3

DeepHermes-3 trên Hugging Face

Nous hôm nay đã viết rằng các nhà nghiên cứu của họ “hy vọng phương pháp độc đáo của chúng tôi đối với chế độ suy luận có thể chuyển đổi, do người dùng kiểm soát sẽ thúc đẩy sứ mệnh của chúng tôi là cung cấp cho những người sử dụng DeepHermes nhiều khả năng điều khiển hơn cho bất kỳ nhu cầu nào họ có.”

Xây Dựng Trên Hermes 3: Phương Pháp Tiếp Cận Dữ Liệu Và Đào Tạo

DeepHermes-3 được xây dựng dựa trên Hermes 3, một bộ dữ liệu đa miền được tuyển chọn tỉ mỉ mà Nous Research đã phát triển cho loạt Hermes 3 rộng lớn hơn. Hermes 3 là nền tảng quan trọng cho sự phát triển của DeepHermes-3.

Theo Báo cáo Kỹ thuật Hermes 3 được phát hành vào tháng 8, bộ dữ liệu này bao gồm khoảng 390 triệu token trải rộng trên các miền hướng dẫn và suy luận đa dạng.

Bộ dữ liệu được chia thành các danh mục chính sau:

  • Hướng dẫn chung (60.6%): Các lời nhắc rộng, mở tương tự như những lời nhắc được tìm thấy trong các mô hình trò chuyện AI đa năng.
  • Dữ liệu chuyên gia về miền (12.8%): Kiến thức chuyên môn trong các lĩnh vực như khoa học, luật và kỹ thuật.
  • Toán học (6.7%): Các bộ dữ liệu giải quyết vấn đề nâng cao nhằm cải thiện khả năng suy luận số và logic.
  • Nhập vai và viết sáng tạo (6.1%): Dữ liệu được thiết kế để tăng cường khả năng kể chuyện và đối thoại mô phỏng.
  • Mã hóa và phát triển phần mềm (4.5%): Tạo mã và gỡ lỗi các tác vụ.
  • Sử dụng công cụ, suy luận tác nhân và tạo tăng cường truy xuất (RAG) (4.3%): Đào tạo về gọi hàm, lập kế hoạch và truy xuất kiến thức.
  • Tạo nội dung (3.0%): Viết, tóm tắt và các tác vụ đầu ra có cấu trúc.
  • Điều khiển và căn chỉnh (2.5%): Dữ liệu tập trung vào việc làm cho mô hình có khả năng điều khiển cao và đáp ứng các lời nhắc của người dùng.
XEM THÊM:  cài đặt n8n với Docker | Tài liệu n8n

Ngoài ra, thành viên nhóm nghiên cứu Nous Research ẩn danh @Teknium (@Teknium1 trên X) đã viết trong phản hồi cho người dùng máy chủ Discord của công ty rằng mô hình này được đào tạo trên “1M non cots và 150K cots,” hoặc 1 triệu đầu ra không CoT và 150,000 đầu ra CoT.

Sự kết hợp dữ liệu này hỗ trợ khả năng độc đáo của DeepHermes-3 trong việc chuyển đổi giữa các phản hồi trực quan và suy luận có cấu trúc sâu sắc, một tính năng quan trọng giúp phân biệt nó với các LLM khác. Sự kết hợp dữ liệu đa dạng này là chìa khóa cho khả năng linh hoạt của DeepHermes-3.

Cách Chế Độ Suy Luận Có Thể Chuyển Đổi Hoạt Động

DeepHermes-3 cho phép người dùng kiểm soát độ sâu suy luận của nó bằng cách sử dụng một lời nhắc hệ thống. Người dùng phải nhập văn bản sau trước một lời nhắc để “bật” chế độ suy luận của mô hình:

Bạn là một AI suy nghĩ sâu sắc, bạn có thể sử dụng các chuỗi suy nghĩ cực kỳ dài để xem xét sâu sắc vấn đề và cân nhắc với chính mình thông qua các quy trình suy luận có hệ thống để giúp đưa ra giải pháp chính xác trước khi trả lời. Bạn nên bao gồm những suy nghĩ và độc thoại nội tâm của mình bên trong các thẻ <think></think>, và sau đó cung cấp giải pháp hoặc phản hồi của bạn cho vấn đề.

Khi chế độ suy luận được bật, mô hình xử lý thông tin trong CoT dài, cho phép nó cân nhắc một cách có hệ thống trước khi tạo ra câu trả lời. Chế độ suy luận giúp mô hình đưa ra các quyết định chính xác hơn.

Điều này đạt được bằng cách sử dụng các thẻ <think></think>, nơi độc thoại nội tâm của mô hình được cấu trúc trước khi trình bày một giải pháp cuối cùng.

Ở chế độ phản hồi tiêu chuẩn, mô hình hoạt động giống như một chatbot AI truyền thống hơn, cung cấp các phản hồi dựa trên trực giác nhanh hơn mà không cần xử lý logic sâu sắc.

Thông Tin Chi Tiết Về Hiệu Suất Và Phản Hồi Từ Cộng Đồng

Việc đánh giá chuẩn sớm và thử nghiệm cộng đồng đã cung cấp những thông tin chi tiết quan trọng về khả năng của DeepHermes-3:

  • Suy luận toán học: DeepHermes-3 đạt 67% trên các chuẩn MATH, so với 89.1% cho mô hình R1-distilled của DeepSeek. Mặc dù DeepSeek vượt trội hơn nó trong các tác vụ toán học thuần túy, Nous Research định vị DeepHermes-3 là một mô hình tổng quát hơn với các kỹ năng trò chuyện và suy luận rộng hơn.
  • Cuộc trò chuyện nhiều lượt: Một số người thử nghiệm báo cáo rằng chế độ suy luận kích hoạt chính xác trên phản hồi đầu tiên, nhưng có thể không duy trì trong các cuộc trò chuyện mở rộng. Các thành viên cộng đồng đề xuất thực thi <think>\n ở đầu mỗi phản hồi, một phương pháp cũng được sử dụng trong DeepSeek-R1.
  • Gọi hàm: DeepHermes-3 hỗ trợ sử dụng công cụ, mặc dù nó không được đào tạo rõ ràng để tích hợp chế độ suy luận và gọi hàm đồng thời. Một số người dùng báo cáo rằng mặc dù kết hợp cả hai tính năng giúp cải thiện độ chính xác trong việc thực hiện các công cụ, nhưng kết quả vẫn không nhất quán.
XEM THÊM:  Lệnh back up thủ công data sql bằng dòng lệnh linux server tự động thêm ngày tháng, giờ phút vào tên file

Nous Research đang tích cực thu thập phản hồi của người dùng để tinh chỉnh tính bền bỉ của suy luận và cải thiện các tương tác nhiều lượt. Phản hồi từ cộng đồng là yếu tố quan trọng để cải thiện DeepHermes-3.

Triển Khai Và Hiệu Suất Phần Cứng

Macbook Pro M4 Max

DeepHermes-3 thử nghiệm trên Macbook Pro M4 Max

DeepHermes-3 có sẵn để thử nghiệm trên Hugging Face, với các phiên bản lượng tử hóa GGUF được tối ưu hóa cho phần cứng công suất thấp. Mô hình này tương thích với vLLM để suy luận và sử dụng định dạng Llama-Chat cho đối thoại nhiều lượt.

Một người dùng đã báo cáo tốc độ xử lý là 28.98 token mỗi giây trên MacBook Pro M4 Max, chứng minh rằng mô hình có thể chạy hiệu quả trên phần cứng tiêu dùng.

DeepHermes-3 dựa trên mô hình Llama 3 của Meta và được điều chỉnh bởi Giấy phép Cộng đồng Meta Llama 3. Mặc dù mô hình này có sẵn miễn phí để sử dụng, sửa đổi và phân phối lại, nhưng một số điều kiện được áp dụng:

  • Phân phối lại: Bất kỳ mô hình hoặc triển khai phái sinh nào phải bao gồm giấy phép gốc và hiển thị nổi bật “Được xây dựng với Meta Llama 3.”
  • Hạn chế đối với đào tạo mô hình: Người dùng không thể sử dụng DeepHermes-3 (hoặc Llama 3) để đào tạo các LLM khác, ngoại trừ các tác phẩm phái sinh dựa trên Llama 3 một cách rõ ràng.
  • Cấp phép thương mại cho các công ty lớn: Các tổ chức có hơn 700 triệu người dùng hoạt động hàng tháng phải được Meta phê duyệt rõ ràng trước khi sử dụng mô hình này cho mục đích thương mại.
  • Chính sách sử dụng được chấp nhận: Người dùng phải tuân thủ các hạn chế sử dụng AI của Meta, cấm các ứng dụng trong các lĩnh vực như thông tin sai lệch, giám sát và tạo nội dung có hại.

Những quy tắc phân phối lại và giới hạn thương mại này có nghĩa là DeepHermes-3 không hoàn toàn là mã nguồn mở theo nghĩa truyền thống, mặc dù nó có sẵn trên Hugging Face, không giống như mô hình suy luận R1 đình đám của đối thủ Trung Quốc DeepSeek, mô hình này có sẵn theo Giấy phép MIT cho phép.

Hướng Tới Hermes 4

DeepHermes-3 được phát triển bởi @teknium, @emozilla, @Gifted Gummy Bee, @hjc-puro và @jsupha, với Nous Research ghi nhận cộng đồng mã nguồn mở đã đóng góp vào các bộ dữ liệu, công cụ đánh giá và đào tạo mô hình.

Nous Research coi mô hình xem trước này là một bước đệm hướng tới bản phát hành lớn tiếp theo, Hermes 4, dự kiến sẽ tinh chỉnh hơn nữa khả năng suy luận và đàm thoại của nó. Hermes 4 hứa hẹn sẽ mang lại nhiều cải tiến đáng kể.

Tầm Quan Trọng Của DeepHermes-3 Trong Bối Cảnh AI Hiện Nay

Trong bối cảnh mà các mô hình AI ngày càng trở nên phức tạp và chuyên biệt, DeepHermes-3 nổi bật như một giải pháp linh hoạtdễ tiếp cận. Khả năng chuyển đổi giữa chế độ suy luận sâu và phản hồi nhanh chóng giúp mô hình này phù hợp với nhiều ứng dụng khác nhau, từ giải quyết các vấn đề phức tạp đến tương tác tự nhiên với người dùng.

Lợi Ích Của Việc Sử Dụng DeepHermes-3

Việc sử dụng DeepHermes-3 mang lại nhiều lợi ích đáng kể:

  • Cá Nhân Hóa Trải Nghiệm : Mô hình cho phép người dùng tùy chỉnh cách thức AI phản hồi, tạo ra trải nghiệm phù hợp với nhu cầu cá nhân.
  • Tăng Cường Khả Năng Suy Luận : Chế độ suy luận sâu giúp mô hình đưa ra các quyết định chính xác hơn và giải quyết các vấn đề phức tạp một cách hiệu quả.
  • Tiết Kiệm Chi Phí : Phiên bản lượng tử hóa GGUF giúp mô hình chạy hiệu quả trên phần cứng tiêu dùng, giảm chi phí đầu tư cho doanh nghiệp và cá nhân.
  • Dễ Dàng Tiếp Cận : Mô hình có sẵn trên Hugging Face, giúp các nhà phát triển dễ dàng tiếp cận và tích hợp vào các ứng dụng của mình.
XEM THÊM:  AI Agent là gì? Hướng dẫn toàn diện cho người mới bắt đầu

Các Ứng Dụng Tiềm Năng Của DeepHermes-3

DeepHermes-3 có tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực:

  • Giáo Dục : Hỗ trợ học sinh và sinh viên trong việc giải quyết các bài toán phức tạp và tìm hiểu kiến thức mới.
  • Chăm Sóc Sức Khỏe : Cung cấp thông tin y tế chính xác và hỗ trợ bác sĩ trong việc chẩn đoán bệnh.
  • Dịch Vụ Khách Hàng : Tự động hóa các tác vụ hỗ trợ khách hàng và cung cấp trải nghiệm cá nhân hóa.
  • Nghiên Cứu Khoa Học : Hỗ trợ các nhà khoa học trong việc phân tích dữ liệu và đưa ra các giả thuyết mới.

So Sánh DeepHermes-3 Với Các Mô Hình AI Khác

So với các mô hình AI khác, DeepHermes-3 có những ưu điểm nổi bật sau:

  • Khả Năng Suy Luận Linh Hoạt : Mô hình có thể chuyển đổi giữa chế độ suy luận sâu và phản hồi nhanh chóng, giúp nó phù hợp với nhiều tình huống khác nhau.
  • Tính Cá Nhân Hóa Cao : Người dùng có thể tùy chỉnh cách thức AI phản hồi, tạo ra trải nghiệm phù hợp với nhu cầu cá nhân.
  • Dễ Dàng Triển Khai : Mô hình có thể chạy hiệu quả trên phần cứng tiêu dùng, giúp các doanh nghiệp và cá nhân dễ dàng triển khai.
  • Mã Nguồn Mở : Mô hình có sẵn trên Hugging Face, giúp các nhà phát triển dễ dàng tiếp cận và tích hợp vào các ứng dụng của mình.

Những Thách Thức Và Cơ Hội Trong Tương Lai

Mặc dù DeepHermes-3 mang lại nhiều tiềm năng, vẫn còn những thách thức cần vượt qua:

  • Duy Trì Tính Ổn Định Của Suy Luận : Đảm bảo rằng chế độ suy luận sâu hoạt động ổn định trong các cuộc trò chuyện dài và phức tạp.
  • Tích Hợp Với Các Công Cụ Khác : Cải thiện khả năng tích hợp với các công cụ khác như gọi hàm và truy xuất thông tin.
  • Đảm Bảo Tính An Toàn Và Đạo Đức : Ngăn chặn mô hình tạo ra nội dung có hại hoặc thông tin sai lệch.

Tuy nhiên, những thách thức này cũng tạo ra những cơ hội lớn cho sự phát triển của DeepHermes-3:

  • Cải Thiện Khả Năng Suy Luận : Tiếp tục nghiên cứu và phát triển các thuật toán suy luận mới để tăng cường khả năng của mô hình.
  • Mở Rộng Ứng Dụng : Khám phá các ứng dụng mới trong các lĩnh vực như giáo dục, chăm sóc sức khỏe và dịch vụ khách hàng.
  • Xây Dựng Cộng Đồng : Tạo ra một cộng đồng mạnh mẽ gồm các nhà phát triển, nhà nghiên cứu và người dùng để cùng nhau phát triển mô hình.

Kết Luận

DeepHermes-3 là một mô hình AI đầy hứa hẹn với khả năng suy luận linh hoạt và tính cá nhân hóa cao. Mô hình này có tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực và có thể đóng góp quan trọng vào sự phát triển của trí tuệ nhân tạo. Mặc dù vẫn còn những thách thức cần vượt qua, DeepHermes-3 đang mở ra một kỷ nguyên mới của AI, nơi mà các mô hình có thể tương tác với con người một cách tự nhiên và hiệu quả hơn.

Bạn có thấy hữu ích không? Hãy cho chúng tôi +1 nhé

Đăng ký nhận bản tin từ Website TXL

Tìm kiếm tức thì các thông tin tại website: tranxuanloc.com

Mẹo tìm kiếm: "Từ khóa cần tìm kiếm" site:tranxuanloc.com để tìm được kết quả chính xác trên công cụ tìm kiếm của google

Trần Xuân Lộc Blog cung cấp dịch vụ

TOP ĐỐI TÁC CUNG CẤP DỊCH VỤ DU LỊCH TRỰC TUYẾN HÀNG ĐẦU

(Đặt phòng, đặt tour, đặt xe, đặt vé máy bay...Nhấn vào link logo để đặt dịch vụ với nhiều ưu đãi hấp dẫn)

Cảnh báo: Hiện nay có rất nhiều đơn vị SỬ DỤNG LẠI các THÔNG TIN NỘI DUNG ĐÀO TẠO của KHÓA HỌC SALE OTA TỪ OTAVN mà không đảm bảo chất lượng và hỗ trợ về sau. Các bạn muốn đăng ký học SALE OTA uy tín hãy liên hệ trực tiếp với OTA Việt Nam. OTAVN có xây dựng các hình thức đào tạo trực tiếp offline cho doanh nghiệp, đào tạo 1-1 từ xa và tự học online. Chúng tôi có 2 tên miền là: otavietnam.com và tranxuanloc.com (founder) có chia sẻ và đăng tải các thông tin liên quan về OTA/ Sale OTA/ Digital Marketing/ Thiết kế website... Với khách hàng/ đối tác đã sử dụng dịch vụ của OTAVN sẽ được HỖ TRỢ MIỄN PHÍ các vấn đề phát sinh, tư vấn giải đáp sau khi đã hoàn thành khóa học hoặc sau khi đã sử dụng dịch vụ trọn đời. Hotline:0934552325 (iMessage/ Zalo/ Whatsapp) - Email: [email protected]