基于InternLM的答题卡选项识别技术 #3040
Jianfeng777
started this conversation in
project
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
📝 项目简介:基于 InternLM 的答题卡选项识别技术
本项目构建了一个端到端的智能识别系统,能够对考试答题卡中的选择题答案进行精准提取与结构化输出。整体流程融合了计算机视觉、多模态理解与大语言模型技术,核心模块包括:
InternVL 多模态模型:对 OCR 结果进行图文校对,确保答案识别的准确性;
InternLM2.5-20B 大语言模型:将校对后的内容进行格式化,输出标准化的“题号. 选项”结构。
该系统具有较强的鲁棒性与可扩展性,支持多图批处理、自动矫正图片方向、对识别错误进行自动补救与二次优化,广泛适用于高校课程的自动阅卷与教育评测系统建设。
🔁 系统整体流程图
A[输入:答题卡图片或压缩包] --> B[图像预处理:方向矫正]
B --> C[mmdetection检测答题区域]
C --> D[裁剪出答题区域图像]
D --> E[识别题号与选项]
E --> F[结构化匹配:题号 ↔ 答案]
F --> G[InternVL 校对识别内容]
G --> H[InternLM2.5 格式化为统一结构]
H --> I[输出:结构化CSV + 学生txt文档]
Beta Was this translation helpful? Give feedback.
All reactions