对,你没看错, 270M,不是270B。这是个多模态模型,能接受文本和图片输入,并且输出文本。输入图片会标准化为 896 x 896 分辨率。 官方并没有做过多的介绍。不过这种大小的模型通常可以放在移动端设备运行。 模型地址:[http://huggingface.co/google/gemma-3-270m](https://t.co/ChOhs3STsW) <img width="1155" height="1319" alt="Image" src="https://github.com/user-attachments/assets/5914a5c8-be7c-43b4-a9fe-2346149dea9c" />