Các kỹ sư cũ của Google và Apple ra mắt nền tảng Oumi AI mã nguồn mở vô điều kiện, có thể giúp xây dựng DeepSeek tiếp theo
Nhưng chính xác thì AI mã nguồn mở là gì? Đối với Meta và các mô hình Llama của nó, điều đó có nghĩa là được tự do truy cập để sử dụng mô hình, với một số điều kiện nhất định. DeepSeek có sẵn theo giấy phép mã nguồn mở cho phép, cung cấp quyền truy cập đáng kể vào kiến trúc và khả năng của nó. Tuy nhiên, mã đào tạo cụ thể và các phương pháp chi tiết, đặc biệt là những phương pháp liên quan đến các kỹ thuật học tăng cường (RL) như Tối ưu hóa Chính sách Tương đối Nhóm (GRPO), chưa được công khai. Sự thiếu sót này hạn chế khả năng của cộng đồng trong việc hiểu và sao chép đầy đủ quy trình đào tạo của mô hình.
Tuy nhiên, điều mà cả DeepSeek và Llama đều không cho phép là quyền truy cập vô điều kiện đầy đủ vào tất cả mã mô hình, bao gồm cả trọng số cũng như dữ liệu đào tạo. Nếu không có tất cả thông tin đó, các nhà phát triển vẫn có thể làm việc với mô hình mở nhưng họ không có tất cả các công cụ và thông tin chi tiết cần thiết để hiểu cách nó thực sự hoạt động và quan trọng hơn là cách xây dựng một mô hình hoàn toàn mới. Đó là một thách thức mà một công ty khởi nghiệp mới do các cựu chiến binh AI của Google và Apple dẫn đầu đang hướng tới giải quyết.
Ra mắt hôm nay, Oumi được hỗ trợ bởi liên minh của 13 trường đại học nghiên cứu hàng đầu bao gồm Princeton, Stanford, MIT, UC Berkeley, Đại học Oxford, Đại học Cambridge, Đại học Waterloo và Carnegie Mellon. Những người sáng lập Oumi đã huy động được 10 triệu đô la, một vòng hạt giống khiêm tốn mà họ cho là đáp ứng được nhu cầu của mình. Trong khi các công ty lớn như OpenAI đang cân nhắc các khoản đầu tư 500 tỷ đô la vào các trung tâm dữ liệu khổng lồ thông qua các dự án như Stargate, Oumi đang đi theo một cách tiếp cận hoàn toàn khác. Nền tảng này cung cấp cho các nhà nghiên cứu và nhà phát triển một bộ công cụ hoàn chỉnh để xây dựng, đánh giá và triển khai các mô hình nền tảng.
Oussama Elachqar, đồng sáng lập của Oumi và trước đây là kỹ sư học máy tại Apple, nói với VentureBeat: “Ngay cả những công ty lớn nhất cũng không thể tự mình làm điều này. “Chúng tôi đã làm việc một cách hiệu quả trong các silo tại Apple và có rất nhiều silo khác đang xảy ra trên toàn ngành. Cần có một cách tốt hơn để phát triển các mô hình này một cách hợp tác.”
Các mô hình mã nguồn mở như DeepSeek và Llama còn thiếu gì
Giám đốc điều hành của Oumi và cựu quản lý kỹ thuật cấp cao về AI của Google Cloud, Manos Koukoumidis, nói với VentureBeat rằng các nhà nghiên cứu liên tục nói với ông rằng việc thử nghiệm AI đã trở nên cực kỳ phức tạp.
Mặc dù các mô hình mở ngày nay là một bước tiến, nhưng vẫn chưa đủ. Koukoumidis giải thích rằng với các mô hình AI “mở” hiện tại như DeepSeek-R1 và Llama, một tổ chức có thể sử dụng mô hình và triển khai nó trên của riêng họ. Điều còn thiếu là bất kỳ ai khác muốn xây dựng dựa trên mô hình đều không biết chính xác nó được xây dựng như thế nào.
Những người sáng lập Oumi tin rằng sự thiếu minh bạch này là một trở ngại lớn cho nghiên cứu và phát triển AI hợp tác. Ngay cả một dự án như Llama cũng đòi hỏi các nhà nghiên cứu phải nỗ lực đáng kể để tìm ra cách tái tạo và xây dựng dựa trên công việc.
Cách Oumi hoạt động để mở AI cho người dùng doanh nghiệp, nhà nghiên cứu và mọi người khác
Nền tảng Oumi hoạt động bằng cách cung cấp một môi trường tất cả trong một giúp hợp lý hóa các quy trình làm việc phức tạp liên quan đến việc xây dựng các mô hình AI.
Koukoumidis giải thích rằng để xây dựng một mô hình nền tảng, thường có 10 hoặc nhiều bước cần phải thực hiện, thường là song song. Oumi tích hợp tất cả các công cụ và quy trình làm việc cần thiết vào một môi trường thống nhất, loại bỏ nhu cầu các nhà nghiên cứu phải ghép lại và định cấu hình các thành phần mã nguồn mở khác nhau.
Các tính năng kỹ thuật chính bao gồm:
- Hỗ trợ các mô hình từ 10M đến 405B tham số
- Triển khai các kỹ thuật đào tạo nâng cao bao gồm SFT, LoRA, QLoRA và DPO
- Khả năng tương thích với cả mô hình văn bản và đa phương thức
- Các công cụ tích hợp để tổng hợp và quản lý dữ liệu đào tạo bằng cách sử dụng các giám khảo LLM
- Các tùy chọn triển khai thông qua các công cụ suy luận hiện đại như vLLM và SGLang
- Đánh giá mô hình toàn diện trên các điểm chuẩn tiêu chuẩn của ngành
Koukoumidis giải thích: “Chúng tôi không phải đối phó với địa ngục phát triển mã nguồn mở khi tìm ra những gì bạn có thể kết hợp và những gì hoạt động tốt”.
Nền tảng này cho phép người dùng bắt đầu nhỏ, sử dụng máy tính xách tay của riêng họ cho các thử nghiệm ban đầu và đào tạo mô hình. Khi người dùng tiến bộ, họ có thể mở rộng quy mô lên các tài nguyên máy tính lớn hơn, chẳng hạn như các cụm máy tính của trường đại học hoặc nhà cung cấp đám mây, tất cả đều trong cùng một môi trường Oumi.
Bạn không cần cơ sở hạ tầng đào tạo khổng lồ để xây dựng một mô hình mở
Một trong những bất ngờ lớn với DeepSeek-R1 là thực tế nó được xây dựng chỉ với một phần nhỏ tài nguyên mà Meta hoặc OpenAI sử dụng để xây dựng các mô hình của họ.
Khi OpenAI và những công ty khác đầu tư hàng tỷ đô la vào cơ sở hạ tầng tập trung, Oumi đang đặt cược vào một cách tiếp cận phân tán có thể giảm đáng kể chi phí.
Koukoumidis nói: “Ý tưởng rằng bạn cần hàng trăm tỷ [đô la] cho cơ sở hạ tầng AI là sai lầm về cơ bản. “Với điện toán phân tán trên các trường đại học và viện nghiên cứu, chúng ta có thể đạt được kết quả tương tự hoặc tốt hơn với chi phí thấp hơn nhiều.”
Mục tiêu ban đầu của Oumi là xây dựng hệ sinh thái mã nguồn mở của người dùng và nhà phát triển. Nhưng đó không phải là tất cả những gì công ty đã lên kế hoạch. Oumi có kế hoạch phát triển các dịch vụ dành cho doanh nghiệp để giúp các doanh nghiệp triển khai các mô hình này trong môi trường sản xuất.
Bạn có thấy hữu ích không? Hãy cho chúng tôi +1 nhé
Đăng ký nhận bản tin từ Website TXL
Tìm kiếm tức thì các thông tin tại website: tranxuanloc.com
Mẹo tìm kiếm: "Từ khóa cần tìm kiếm" site:tranxuanloc.com để tìm được kết quả chính xác trên công cụ tìm kiếm của googleGỢI Ý: Khóa học sales OTAOTA là gìđăng ký kênh OTAEmail theo tên miềnCRMWP Content Crawlerchuyển VPSACF