Chạy các mô hình cục bộ trên máy Mac trở nên nhanh hơn với sự hỗ trợ MLX của Ollama

Chạy các mô hình cục bộ trên máy Mac trở nên nhanh hơn với sự hỗ trợ MLX của Ollama

Ollama, một hệ thống thời gian chạy để vận hành các mô hình ngôn ngữ lớn trên máy tính cục bộ, đã giới thiệu hỗ trợ cho khung MLX nguồn mở của Apple cho máy học.

Ngoài ra, Ollama cho biết họ đã cải thiện hiệu suất bộ nhớ đệm và hiện hỗ trợ định dạng NVFP4 của Nvidia để nén mô hình, giúp sử dụng bộ nhớ hiệu quả hơn nhiều trong một số mô hình nhất định.

Kết hợp lại, những phát triển này hứa hẹn cải thiện đáng kể hiệu suất trên máy Mac có chip Apple Silicon (M1 trở lên)—và thời điểm không thể tốt hơn, vì các mẫu máy địa phương đang bắt đầu phát triển theo những cách mà trước đây chúng chưa từng có trước các cộng đồng nhà nghiên cứu và người có sở thích bên ngoài.

Thành công vang dội gần đây của OpenClaw — đã đạt được hơn 300.000 sao trên GitHub, gây chú ý với các thử nghiệm như Moltbook và đặc biệt trở thành nỗi ám ảnh ở Trung Quốc — đã khiến nhiều người thử nghiệm các mô hình chạy trên máy của họ.

Đọc toàn bộ bài viết Bình luận

Tôi là một lập trình viên IOS. Code chính là IOS nhưng thỉnnh thoảng vẫn đá sang Android hoặc web. Mặc dù không quá thông thạo nhưng tôi sẽ chia sẻ những kiến thức mà mình đã tìm hiểu, áp dụng qua.

Bài viết liên quan

Delta chọn Amazon Leo cho Wi-Fi trên chuyến bay bắt đầu từ năm 2028

Hai công ty đã công bố Wi-Fi trên chuyến bay trên các chuyến bay của Delta sẽ được cung cấp bởi Amazon Leo bắt đầu từ năm 2028.

Xem thêm

Rec Room, một trò chơi VR theo phong cách Roblox, sắp ngừng hoạt động

Phòng Rec tựa game VR giống Roblox sắp ngừng hoạt động sau khi hoạt động được một thập kỷ.

Xem thêm

DoorDash hợp tác với Rivian spinoff Cũng dành cho các phương tiện giao hàng tự động

Các kế hoạch phân phối tự động của DoorDash cũng sẽ nhận được sự hỗ trợ từ phần phụ Rivian.

Xem thêm
0 0 đánh giá
Article Rating
Theo dõi
Thông báo của
guest
0 Comments
Cũ nhất
Mới nhất Được bỏ phiếu nhiều nhất
Phản hồi nội tuyến
Xem tất cả bình luận