feat: 实现 DdddOcr 核心推理流水线与图像预处理
- 封装 `preprocess_image` 方法,实现 PNG 透明背景修复、灰度化、比例缩放及 NCHW 张量转换。 - 提取 `inference` 逻辑,支持通过 tract-onnx 执行模型推理。 - 实现 `extract_indices` 解析输出张量,支持 I64 索引直接读取与 F32 概率矩阵的 Argmax 处理。 - 完善 `decode_ctc` 解码算法,支持标准 CTC 贪婪搜索与字符集映射。 - 重构 `classification` 主入口,将预处理、推理、解析、解码逻辑解耦,提升代码可维护性。
This commit is contained in:
@@ -5,6 +5,7 @@ edition = "2024"
|
||||
license = "MIT OR Apache-2.0"
|
||||
|
||||
[dependencies]
|
||||
tract-onnx = { version = "0.21.1" }
|
||||
tract-onnx = { version = "0.21.10" }
|
||||
anyhow = "1.0.102"
|
||||
image = "0.25.10"
|
||||
base64 = "0.22.1"
|
||||
|
||||
Reference in New Issue
Block a user