Skip to content
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Original file line number Diff line number Diff line change
@@ -0,0 +1,27 @@
### 姓名

邱文宇

### 实习项目

轻量高效表格识别新范式探索

### 本周工作

1. **调研行业内表格结构识别、框线补全、框线转excel/html的技术方案**

2. **熟悉PaddleX表格识别项目**

* 学习表格单元格检测模块、表格结构识别模块和自优化结果融合算法

* 熟悉工具代码

3. **问题疑惑与解答**

* aistudio按照table_recognition_v2_tutorial.md教程进行数据集测评时报错?

答:导师的测试是正常的,排查代码版本和环境

### 下周工作

1. 进行框线补全实验
Original file line number Diff line number Diff line change
@@ -0,0 +1,25 @@
### 姓名

邱文宇

### 实习项目

轻量高效表格识别新范式探索

### 本周工作

1. **框线补全相关图神经网络算法调研**

2. **框线补全实验**

* 对框线不全数据集进行数据分析和挖掘

* 特征工程和设计子图聚类算法

3. **问题疑惑与解答**

暂无

### 下周工作

1. 继续进行框线补全实验
Original file line number Diff line number Diff line change
@@ -0,0 +1,25 @@
### 姓名

邱文宇

### 实习项目

轻量高效表格识别新范式探索

### 本周工作

1. 梳理[TIES-2.0](https://github.com/shahrukhqasim/TIES-2.0)论文&代码和[caloGraphNN](https://github.com/jkiesele/caloGraphNN)并进行优化

TIES2.0项目已经长时间未维护,且存在大量未解决issues.

2. **完成图像特征处理和图神经网络部分模型并根据TableMagic v2产线结构进行部分模型优化**

项目地址: [GitHub - ErnestinaQiu/PaddleX-TableRec at my-develop](https://github.com/ErnestinaQiu/PaddleX-TableRec/tree/my-develop)

3. **问题疑惑与解答**

暂无

### 下周工作

1. 完成TIES-2.0整体模型
Original file line number Diff line number Diff line change
@@ -0,0 +1,21 @@
### 姓名

邱文宇

### 实习项目

轻量高效表格识别新范式探索

### 本周工作

1. 表格单元格及行列结构识别模型优化和制作框线补全程序

项目地址: [GitHub - ErnestinaQiu/PaddleX-TableRec at my-develop](https://github.com/ErnestinaQiu/PaddleX-TableRec/tree/my-develop)

2. **问题疑惑与解答**

暂无

### 下周工作

1. 表格单元格及行列结构识别模型优化和框线补全程序指标优化
Original file line number Diff line number Diff line change
@@ -0,0 +1,23 @@
### 姓名

邱文宇

### 实习项目

轻量高效表格识别新范式探索

### 本周工作

1. 数据集收集、制作和benchmark确认

2. 目标检测和实例分割方案分析和实验



1. **问题疑惑与解答**

暂无

### 下周工作

1. 实验分割方案构建和测试
Original file line number Diff line number Diff line change
@@ -0,0 +1,22 @@
### 姓名

邱文宇

### 实习项目

轻量高效表格识别新范式探索

### 本周工作

1. 对v2在测试集上的指标表现进行归因分析

1. **问题疑惑与解答**

* 对v2在新数据集上的表现以及所适配的场景进行了讨论

解答:明确了目前v2模型的适配场景和基于当前测试集的痛点,确定了优先基于v2框架进行部分算法模块进行优化的思路

### 下周工作

1. v2在测试集上的指标表现进行归因分析
2. 明确优化思路和具体算法
Original file line number Diff line number Diff line change
@@ -0,0 +1,15 @@
### 姓名

邱文宇

### 实习项目

轻量高效表格识别新范式探索

### 本周工作

1. 对v2在测试集上的指标表现进行归因分析

### 下周工作

1. 大类问题定位与优化实验
Original file line number Diff line number Diff line change
@@ -0,0 +1,15 @@
### 姓名

邱文宇

### 实习项目

轻量高效表格识别新范式探索

### 本周工作

1. 大类问题定位与优化实验

### 下周工作

1. 大类问题定位与优化实验
Loading