Phòng Thí Nghiệm AI “Cá Nhân Hóa, Không Hạn Chế” Nous Research Ra Mắt Mô Hình Lý Luận Đầu Tiên: DeepHermes-3

Giới thiệu về DeepHermes-3: Mô hình AI lý luận đột phá

Trong bối cảnh các mô hình AI lý luận đang ngày càng trở nên phổ biến, DeepHermes-3 nổi lên như một sự đổi mới đáng chú ý. Được phát triển bởi Nous Research, một tập thể kỹ sư với sứ mệnh tạo ra các mô hình AI “cá nhân hóa, không hạn chế”, DeepHermes-3 hứa hẹn mang đến khả năng lý luận và xử lý ngôn ngữ trực quan vượt trội.

DeepHermes-3

Nous Research: Tiên phong trong lĩnh vực AI mở

Nous Research, kể từ khi thành lập tại New York City vào năm 2023, đã tập trung vào việc tinh chỉnh và đào tạo lại các mô hình nguồn mở như Llama của Meta và các mô hình từ startup Mistral của Pháp. Mục tiêu của họ là tạo ra các mô hình AI linh hoạt và dễ tiếp cận, phục vụ nhu cầu đa dạng của người dùng.

DeepHermes-3 Preview, mô hình lý luận mở mới nhất của họ, là một minh chứng cho cam kết này. Nó được mô tả là một “LLM [mô hình ngôn ngữ lớn] thống nhất khả năng lý luận và mô hình ngôn ngữ trực quan”, cho phép người dùng chuyển đổi giữa các quy trình lý luận dài hơn và các phản hồi ngắn hơn, nhanh hơn, ít tốn kém về mặt tính toán hơn.

DeepHermes-3: Sự kết hợp giữa lý luận và trực giác

DeepHermes-3 là một biến thể 8 tỷ tham số (số lượng cài đặt) của Hermes 3, bản thân nó là một biến thể của Llama do Meta phát triển. Điểm đặc biệt của DeepHermes-3 là khả năng tham gia vào các cuộc trao đổi giống như siêu nhận thức, suy nghĩ về bản thân và vai trò của AI so với ý thức của con người, thậm chí gây ra một cuộc khủng hoảng hiện sinh trong các đầu ra của mô hình.

Khả năng của DeepHermes-3

Người dùng có thể tải xuống mã mô hình đầy đủ trên HuggingFace và một phiên bản đã được lượng tử hóa (giảm số lượng bit) và lưu trong định dạng thống nhất do GPT tạo ra (GGUF), được thiết kế để chạy các suy luận mô hình (bản dựng sản xuất thực tế, trái ngược với đào tạo) trên PC và máy chủ cấp tiêu dùng.

Nous Research hy vọng rằng “cách tiếp cận độc đáo của chúng tôi đối với chế độ lý luận có thể chuyển đổi, do người dùng kiểm soát sẽ thúc đẩy sứ mệnh của chúng tôi là cung cấp cho những người sử dụng DeepHermes khả năng điều khiển nhiều hơn cho bất kỳ nhu cầu nào họ có.”

Xây dựng trên Hermes 3: Dữ liệu và phương pháp đào tạo

DeepHermes-3 được xây dựng dựa trên Hermes 3, một tập dữ liệu đa miền được tuyển chọn tỉ mỉ mà Nous Research đã phát triển cho dòng Hermes 3 rộng lớn hơn. Theo Báo cáo Kỹ thuật Hermes 3 được phát hành vào tháng 8, tập dữ liệu này bao gồm khoảng 390 triệu mã thông báo trải rộng trên các miền hướng dẫn và dựa trên lý luận đa dạng.

Dữ liệu và phương pháp đào tạo

Tập dữ liệu được chia thành các danh mục chính sau:

Hướng dẫn chung (60,6%): Các lời nhắc rộng, mở tương tự như những lời nhắc được tìm thấy trong các mô hình trò chuyện AI đa năng.
Dữ liệu chuyên gia miền (12,8%): Kiến thức chuyên môn trong các lĩnh vực như khoa học, luật và kỹ thuật.
Toán học (6,7%): Các tập dữ liệu giải quyết vấn đề nâng cao nhằm cải thiện khả năng lý luận số và logic.
Nhập vai và viết sáng tạo (6,1%): Dữ liệu được thiết kế để nâng cao khả năng kể chuyện và đối thoại mô phỏng.
Mã hóa và phát triển phần mềm (4,5%): Tạo mã và các tác vụ gỡ lỗi.
Sử dụng công cụ, lý luận đại diện và tạo tăng cường truy xuất (RAG) (4,3%): Đào tạo về gọi hàm, lập kế hoạch và truy xuất kiến thức.
Tạo nội dung (3,0%): Viết, tóm tắt và các tác vụ đầu ra có cấu trúc.
Điều khiển và căn chỉnh (2,5%): Dữ liệu tập trung vào việc làm cho mô hình có khả năng điều khiển cao và đáp ứng các lời nhắc của người dùng.

Ngoài ra, thành viên nhóm Nous Research ẩn danh @Teknium (@Teknium1 trên X) đã viết để trả lời một người dùng trên máy chủ Discord của công ty rằng mô hình đã được đào tạo trên “1M non cots và 150K cots”, hoặc 1 triệu đầu ra không phải CoT và 150.000 đầu ra CoT.

Sự kết hợp dữ liệu này hỗ trợ khả năng độc đáo của DeepHermes-3 trong việc chuyển đổi giữa các phản hồi trực quan và lý luận sâu sắc, có cấu trúc, một tính năng chính giúp phân biệt nó với các LLM khác.

Cách thức hoạt động của chế độ lý luận có thể chuyển đổi

DeepHermes-3 cho phép người dùng kiểm soát độ sâu lý luận của nó bằng cách sử dụng lời nhắc hệ thống. Người dùng phải nhập văn bản sau trước một lời nhắc để “bật” chế độ lý luận của mô hình:

“Bạn là một AI suy nghĩ sâu sắc, bạn có thể sử dụng các chuỗi suy nghĩ cực kỳ dài để xem xét sâu sắc vấn đề và cân nhắc với chính mình thông qua các quy trình lý luận có hệ thống để giúp đưa ra giải pháp chính xác trước khi trả lời. Bạn nên kèm theo những suy nghĩ và độc thoại nội tâm của mình bên trong các thẻ và sau đó cung cấp giải pháp hoặc phản hồi của bạn cho vấn đề.”

Khi chế độ lý luận được bật, mô hình xử lý thông tin trong CoT dài, cho phép nó cân nhắc một cách có hệ thống trước khi tạo ra câu trả lời.

Điều này đạt được bằng cách sử dụng các thẻ <think></think>, nơi độc thoại nội tâm của mô hình được cấu trúc trước khi trình bày một giải pháp cuối cùng.

Ở chế độ phản hồi tiêu chuẩn, mô hình hoạt động giống như một chatbot AI truyền thống hơn, cung cấp các phản hồi nhanh hơn, dựa trên trực giác mà không cần xử lý logic sâu.

Thông tin chi tiết về hiệu suất và phản hồi của cộng đồng

Các điểm chuẩn ban đầu và thử nghiệm cộng đồng đã cung cấp những thông tin chi tiết quan trọng về khả năng của DeepHermes-3:

Lý luận toán học: DeepHermes-3 đạt 67% trên các điểm chuẩn MATH, so với 89,1% cho mô hình R1-distilled của DeepSeek. Mặc dù DeepSeek vượt trội hơn trong các tác vụ toán học thuần túy, Nous Research định vị DeepHermes-3 là một mô hình tổng quát hơn với các kỹ năng lý luận và đàm thoại rộng hơn.
Cuộc trò chuyện nhiều lượt: Một số người thử nghiệm báo cáo rằng chế độ lý luận kích hoạt chính xác trên phản hồi đầu tiên, nhưng có thể không duy trì trong các cuộc trò chuyện mở rộng. Các thành viên cộng đồng đề xuất thực thi \n ở đầu mỗi phản hồi, một phương pháp cũng được sử dụng trong DeepSeek-R1.
Gọi hàm: DeepHermes-3 hỗ trợ sử dụng công cụ, mặc dù nó không được đào tạo rõ ràng để tích hợp chế độ lý luận và gọi hàm đồng thời. Một số người dùng báo cáo rằng mặc dù kết hợp cả hai tính năng giúp cải thiện độ chính xác trong việc thực thi các công cụ, nhưng kết quả vẫn không nhất quán.

Nous Research đang tích cực thu thập phản hồi của người dùng để tinh chỉnh tính bền bỉ của lý luận và cải thiện các tương tác nhiều lượt.

Triển khai và hiệu suất phần cứng

DeepHermes-3 có sẵn để thử nghiệm trên Hugging Face, với các phiên bản lượng tử hóa GGUF được tối ưu hóa cho phần cứng công suất thấp. Mô hình tương thích với vLLM để suy luận và sử dụng định dạng Llama-Chat cho đối thoại nhiều lượt.

Triển khai và hiệu suất

Một người dùng đã báo cáo tốc độ xử lý là 28,98 mã thông báo mỗi giây trên MacBook Pro M4 Max, chứng minh rằng mô hình có thể chạy hiệu quả trên phần cứng tiêu dùng.

Giấy phép Meta Llama 3 Community License

DeepHermes-3 dựa trên mô hình Llama 3 của Meta và chịu sự điều chỉnh của Giấy phép Meta Llama 3 Community License. Mặc dù mô hình có sẵn miễn phí để sử dụng, sửa đổi và phân phối lại, nhưng một số điều kiện được áp dụng:

Phân phối lại: Bất kỳ mô hình hoặc triển khai phái sinh nào phải bao gồm giấy phép gốc và hiển thị nổi bật “Được xây dựng bằng Meta Llama 3”.
Hạn chế đối với đào tạo mô hình: Người dùng không thể sử dụng DeepHermes-3 (hoặc Llama 3) để đào tạo các LLM khác, ngoại trừ các tác phẩm phái sinh dựa trên Llama 3 một cách rõ ràng.
Cấp phép thương mại cho các công ty lớn: Các tổ chức có hơn 700 triệu người dùng hoạt động hàng tháng phải có được sự chấp thuận rõ ràng từ Meta trước khi sử dụng mô hình này cho mục đích thương mại.
Chính sách sử dụng chấp nhận được: Người dùng phải tuân thủ các hạn chế sử dụng AI của Meta, cấm các ứng dụng trong các lĩnh vực như thông tin sai lệch, giám sát và tạo nội dung có hại.

Các quy tắc phân phối lại và các giới hạn thương mại này có nghĩa là DeepHermes-3 không hoàn toàn là nguồn mở theo nghĩa truyền thống, mặc dù nó có sẵn trên Hugging Face, không giống như mô hình lý luận R1 của đối thủ DeepSeek của Trung Quốc, có sẵn theo Giấy phép MIT cho phép.

Hướng tới Hermes 4

DeepHermes-3 được phát triển bởi @teknium, @emozilla, @Gifted Gummy Bee, @hjc-puro và @jsupha, với Nous Research ghi nhận cộng đồng nguồn mở đã đóng góp vào các tập dữ liệu, công cụ đánh giá và đào tạo mô hình.

Nous Research coi mô hình xem trước này là một bước đệm hướng tới bản phát hành lớn tiếp theo, Hermes 4, dự kiến sẽ tinh chỉnh hơn nữa khả năng lý luận và đàm thoại của nó.

Kết luận: Tương lai của AI cá nhân hóa và không hạn chế

DeepHermes-3 đại diện cho một bước tiến quan trọng trong lĩnh vực AI, mang đến khả năng lý luận mạnh mẽ và khả năng tùy chỉnh cao cho người dùng. Với sự hỗ trợ từ cộng đồng nguồn mở và cam kết của Nous Research đối với AI “cá nhân hóa, không hạn chế”, DeepHermes-3 hứa hẹn sẽ mở ra những ứng dụng mới và thú vị trong nhiều lĩnh vực khác nhau.

Hy vọng bài viết này đã cung cấp cho bạn cái nhìn tổng quan về DeepHermes-3. Hãy theo dõi để cập nhật thêm thông tin về Hermes 4 và những phát triển mới nhất trong lĩnh vực AI.