陈天奇等人新作 MLC LLM 能在任何设备上编译运行大语言模型,如何理解这一技术?有哪些应用场景?

原作者们也在知乎做了相关介绍,大家可以移步:

如果我没理解错的话,目前的 demo 是基于 vicuna-v1-7b 模型,实现了在移动端 iPhone、消费级 Mac 乃至 Chrome 浏览器[1]端的运行。


这是一个从 https://www.zhihu.com/question/598610139/answer/3008375559 下的原始话题分离的讨论话题