|
|
21bd1c93bf
|
feat: 完成 Rust 滑块匹配算法,修复透明留白导致的坐标偏移
- 实现灰度与边缘两种匹配模式
- 对齐 OpenCV NCC 算法逻辑
- 优化图像灰度化与 Alpha 通道转换
- 提升坐标计算精度至像素级
|
2026-05-08 16:03:33 +08:00 |
|
|
|
1a329ca273
|
refactor: 优化Det算法
- 优化 demo_postprocess,nms算法
- 新增 Slide 滑块识别
- 更新 Cargo.toml 依赖项
|
2026-05-07 18:00:39 +08:00 |
|
|
|
8fcfa2096e
|
refactor: 移除 OpenCV 依赖并实现纯 Rust 图像处理流水线
- 替换 opencv 为 image 库以简化交叉编译
- 修正 nms 逻辑中的 ArrayView 借用问题
- 增加 save_debug_image 方法用于可视化检测框
- 更新 Cargo.toml 依赖项
|
2026-05-06 17:37:38 +08:00 |
|
|
|
cfeb68ad04
|
feat: 重构模型初始化逻辑
- 重构 DdddOcr。
- 新增 DdddOcrBuilder。
- 其他优化
|
2026-05-05 22:18:12 +08:00 |
|
|
|
1c366b7165
|
feat: 重构 CTC 解码逻辑
- 重构 ctc_decode 为关联函数并优化内存分配。
- 增加 单元测试和集成测试
|
2026-05-01 21:54:33 +08:00 |
|
|
|
642fed5d9f
|
feat: 实现 DdddOcr 核心推理流水线与图像预处理
- 封装 `preprocess_image` 方法,实现 PNG 透明背景修复、灰度化、比例缩放及 NCHW 张量转换。
- 提取 `inference` 逻辑,支持通过 tract-onnx 执行模型推理。
- 实现 `extract_indices` 解析输出张量,支持 I64 索引直接读取与 F32 概率矩阵的 Argmax 处理。
- 完善 `decode_ctc` 解码算法,支持标准 CTC 贪婪搜索与字符集映射。
- 重构 `classification` 主入口,将预处理、推理、解析、解码逻辑解耦,提升代码可维护性。
|
2026-04-30 17:54:08 +08:00 |
|