MLC LLM：大型语言模型的高性能部署解决方案

MLC LLM 利用机器学习编译技术，提供通用部署解决方案，增强AI模型的本地运行能力

返回上一页

描述

MLC LLM 提供一个高性能的通用部署解决方案，使任何大型语言模型都能通过本地API以编译加速方式部署，旨在让每个人都能在自己的设备上开发、优化并部署AI模型。

介绍

MLC LLM（Machine Learning Compilation for Large Language Models）是一个为大型语言模型提供的高性能通用部署解决方案。该项目的使命是利用机器学习编译技术，使每个人都能在自己的设备上本地开发、优化和部署AI模型。

平台与硬件支持

MLC LLM 支持以下平台和硬件：

AMD GPU / NVIDIA GPU / Intel GPU：支持 Vulkan, ROCm, CUDA
Apple GPU：支持 macOS 上的 Metal (dGPU) 和 iOS/iPadOS 上的 Metal
Web Browser：支持 WebGPU 和 WASM
Android：支持 Adreno GPU 和 Mali GPU 的 OpenCL

home_open_MLC_LLM_1

快速开始

MLC LLM 使用 4 位量化的 8B Llama-3 模型进行演示。您可以通过以下命令尝试聊天 CLI 或使用 Python API：

    
    mlc_llm chat HF://mlc-ai/Llama-3-8B-Instruct-q4f16_1-MLC
pythonCopy codefrom mlc_llm import MLCEngine

model = "HF://mlc-ai/Llama-3-8B-Instruct-q4f16_1-MLC"
engine = MLCEngine(model)
response = engine.chat.completions.create(
    messages=[{"role": "user", "content": "What is the meaning of life?"}],
    model=model,
    stream=True
)

安装与验证

推荐在隔离的 conda 虚拟环境中安装 MLC LLM，安装后可通过以下命令验证：

    
    python -c "import mlc_llm; print(mlc_llm.__path__)"

REST 服务器部署

您也可以部署一个 REST 服务器，通过 OpenAI 兼容的 API 提供服务：

    
    mlc_llm serve HF://mlc-ai/Llama-3-8B-Instruct-q4f16_1-MLC

API 支持

MLC LLM 提供多种 API 支持，包括 Python API、OpenAI 兼容的 REST-API、C++ API、JavaScript API 和 Web LLM、Swift API for iOS App、Java API 和 Android App。

通过 MLC LLM，我能够在本地设备上直接部署和运行大型语言模型，这不仅提高了运行效率，还增强了数据安全性。

类别

AI开源大模型自然语言处理 AI大模型

松鼠盒子AI是什么？

松鼠盒子AI是专业靠谱的AI人工智能工具评测推荐网站。已收录了国内外上千款AI工具、GPTs应用，涉及AI副业、AI编程、AI写作、AI问答、AI绘画、AI自媒体、AI开源项目等领域，可以通过类别和功能来搜索和过滤这些工具；同时也整理了ChatGPT、Stable Diffusion、Midjourney、Prompt Engineering、Sora等AI工具使用教程。

免责声明

本站内容整理自网络，所提供内容仅供学习使用，请勿做非法用途，不得以任何方式利用本网站提供内容直接或间接从事违反中国法律法规，以及社会公德的行为。若本站内容涉嫌侵犯他人知识产权或其他合法权益的内容，请及时联系立即删除；本站尊重并保护所有用户的个人隐私权。

RPA

八爪鱼RPA

支持一键抓取公众号/小红书/抖音/淘宝数据

流程自动化

付费

AI爆文训练营

图文变现友好赛道，低门槛、高上限，教你从0到1做个赚钱的公众号!

躺着赚钱

￥149/年

何老师陪你做副业

这里聚焦AI副业、个人IP、自媒体运营、写作、赚钱案例。不哔哔，只分享有价值的副业项目。

AI赚钱案例

限免

DeepSeek进阶教程

带你全面掌握DeepSeek应用技巧。提升工作、学习效率

100万人学过

付费

网盘拉新实战教程

每周花费一小时，手把手教你赚网盘平台佣金

500人学过

限时优惠

AiPPT

结合最新AI技术，为用户提供一键生成高质量PPT的解决方案。

一键生成 PPT

免费

豆包MarsCode

一款免费的AI编程助手，全新支持DeepSeek R1/V3、豆包大模型1.5自由切换，免部署、更准确、更强大！

AI编程助手

免费

Monica AI

Monica AI满血复活DeepSeek【免费】，提升您的聊天、搜索、写作和编程体验。

一站式 AI 助手

云服务

腾讯云

综合性的云计算服务平台，现已接入DeepSeek，提供多样化的云解决方案

高效可靠

云服务

阿里云

全球领先的云计算与数据服务平台，提供云服务器、存储、数据库、安全等多种服务

多样化

DeepSeek企业微信码

免费领取DeepSeek资料