GitHub - XS-MLVP/hackathon2512: hackathon resources

2025-12 万众一芯黑客马拉松（第一期）

欢迎参加本次黑客马拉松活动！本次黑客马拉松以“AI驱动开源芯片验证”为主题，聚焦基于大语言模型的硬件验证智能体UCAgent的实际应用。各位将在限定时间内，利用UCAgent人机协同进行UT模块验证，分析Fail test cases，找出赛题中隐藏的Bug。通过参与，您不仅能体验UCAgent工具在开源验证中的便利，还能作为开发者参与到开源芯片验证的生态中。

本次活动提供了15个人工注入的Bug供大家进行发现和分析，共有两个赛道：找Bug赛道和Token效率赛道。

Bug分级： 每个模块含有注入5个bug，分别对应5个RTL原文件，简单难度2个、中等难度1个、困难难度2个。
Bug积分： 简单难度 100分/个，中等难度300分/个, 困难500分/个。
Token效率： 效率 E = Bug个数/消耗总Token

赛道介绍

找Bug赛道：对参赛队伍按获得的Bug积分进行排名（bug数需要大于5个），前三名将获得证书 + 现金奖励，其他名次将获得证书。
效率赛道：利用UCAgent API模式分析Bug，按Token效率进行排名(bug数需不少于12个)，前三名将获得证书 + 现金奖励，其他名次将获得证书。
额外奖励：首位发现Origin版本中的非人工注入Bug，获得现金奖励：500-1000元/个 + 证书。具体金额由UT设计者给出的Bug等级来定。

注：除了效率赛道外，其他赛道可用您任何擅长的工具或者方法，不仅限于UCAgent技术路线。

本仓库介绍

目标：

提供注入Bug的RTL/Scala文件，spec参考地址等资源文件
提供UCAgent基本使用示例，快速生成Fail测试用例（数小时内）

目录结构：

├── Makefile                         # 主执行文件
├── README.md
├── bug_file                         # 注入bug的RTL（有混淆）
│   ├── VectorIdiv_bug_1.v
│   └── ...                          # 活动正式开启后，增加剩余文件
├── origin_file                      # 原始RTL（无混淆），由Scala文件转换而来
│   ├── VectorFloatAdder_origin.v
│   ├── VectorFloatFMA_origin.v
│   └── VectorIdiv_origin.v
├── output                           # UCAgent临时结果存放目录
├── result                           # 最终结果保存目录
├── dutcache                         # DUT-python包缓存目录，防止DUT重复编译，提升效率
└── spec                             # spec文档和验证要求文档
    ├── VectorIdiv.md                # 命名规则 {DUTNAME}.md 和 {DUTNAME}_spec.md
    ├── VectorIdiv_spec.md           # 如果有其他文件，请以 {DUTNAME}_<name>.md 的方法进行命名
    └── ...

UT模块Scala文件地址（源于：YunSuan模块）：

VectorFloatAdder：点击打开
VectorFloatFMA：点击打开
VectorIdiv：点击打开

其他参考文档(请从官方spec中摘取DUT相关内容作为UCAgent的输入)：

RISC-V官方V扩展Spec：点击打开
RISC-V官方ISA-Spec：点击打开

安装依赖

OS环境：建议 ubuntu 24.04 LST （window下建议使用WSL2）

本仓库UCAgent的使用模式为： MCP + iFlow-CLI

请先通过pip安装好UCAgent及其依赖

其他依赖：

Nodejs v20+: 建议通过 nvm https://github.com/nvm-sh/nvm安装Nodejs
npx: 安装命令npm install -g npx，用于免安装执行最新版本 iFlow
Tmux: https://tmuxcheatsheet.com/how-to-install-tmux/

iFlow的MCP和Hooks配置（~/.iflow/settings.json）建议如下：

{
  ...
  "mcpServers": {
    "unitytest": {
      "httpUrl": "http://127.0.0.1:5000/mcp",
      "timeout": 100000     # 调到100s，很多case运行时间比较长，防止超时
    }
  },
  "allowMCPServers": [
    "unitytest"
  ],
  "hooks": {
  "Stop": [{"hooks": [{
"type": "command",
"command": "tmux send-keys `ucagent --hook-message 'continue|quit'`; sleep 1; tmux send-keys Enter",
"timeout": 3
    }]}]
  }
}

上述Hooks用于让iFlow在Tmux中可以自动继续执行而不需要人工干预。

开始运行

# 请先完成依赖安装

git clone https://github.com/XS-MLVP/hackathon2512.git

cd hackathon2512

# 编译DUT (Design Under Test) 该步骤可选
make build_dut_cache

# 自动顺序验证，基于Tmux（需要提前完成iFlow登录认证）
#   VTARGET 参数：用于指定待验证的RTL文件（多文件用`;`隔开，支持通配符）
#   TIMES 参数：用于指定UCAgent的验证次数（重复验证的次数）
#   UCARGS 参数：传递自定义参数到UCAgent
#   如果没有发现DUT，会自动编译
make run # 默认VTARGET为bug_file/*.v;origin_file/*.v
make run VTARGET=bug_file/*.v
make run VTARGET=bug_file/VectorIdiv_bug_1.v TIMES=3

# 修改UCAgent默认参数
TEMPLATE_MUST_FAIL=false make run VTARGET=origin_file/VectorIdiv_origin.v
TEMPLATE_MUST_FAIL=false make run VTARGET=origin_file/*.v

# 单独启动DUT的MCP服务
make run_seq_mcp VTARGET=bug_file/VectorIdiv_bug_1.v PORT=5000

# 继续上次UCAgent， 不加 CONTINUE=1 会清空工作目录重新运行
# 如果需要通过 tmux 正常退出 iflow，请指定 IFLOW_VERSION=0.3.24 （跟高版本有退出bug）
# iFlow更新很快，latest可能不稳定，需要自行选择合适版本，例如 0.3.30
make run_seq_mcp VTARGET=bug_file/VectorIdiv_bug_1.v PORT=5000 CONTINUE=1 IFLOW_VERSION=0.3.24

# 清空临时数据
make clean

# 清空所有
make clean_all

结果位于result/<port>/目录下, port为每次启动时随机选择的MCP端口。 PORT 可以通过参数指定 eg: make run PORT=5005。

请根据您的需要修改Makefile，例如支持 Claude Code 等。

成果提交

注意：所有题目都有提交次数限制，一个组同一个题不能提交超过 5 次

找Bug赛道

提交内容（每个Bug都需要的材料）：
- Bug描述0_bug_description.md：Bug表现描述+可能的原因分析（需要精简）
- Spec分析1_bug_spec_analysis.md：Bug对应Spec的片段分析（与Spec如何不符，需要给出Spec来源连接）
- 测试用例2_test_cases：复现Bug的Fail测试用例（需要能运行，可打包整个UCAgent给出的结果，在bug分析中给出case对应文件和用例名称）

成果提交内容示例：

# 压缩包以： 时间 + 第几次提交命名 + bug简写，例如25年11月20日第01次提交, bug可能是overflow相关
bug25112001_overflow.zip
├── 0_bug_description.md     # bug分析描述，每个文件需要标上序号
├── 1_bug_spec_analysis.md   # spec分析
└── 2_test_cases/            # 可执行的Fail测试用例
└── ...                      # 其他支持文件

效率赛道

提交要求同上 + Langfuse系统中Token消耗截图（需要截出可区分用户的唯一标识）。

额外奖励

提交要求同“找Bug赛道” （无提交次数限制）。

提交地址

成果提交地址：https://82.157.193.13:10101 （暂未开通）

API 模式接入Token监控

Langfuse监控地址：https://82.157.193.13:10102 （暂未开通，用于效率赛道记录 UCAgent 的 Token 使用情况）
在UCAgent的yaml配置中填写(例如：~/.ucagent/setting.yaml)：

langfuse:
  enable: $(ENABLE_LANGFUSE, true)
  public_key: $(LANGFUSE_PUBLIC_KEY, <YOUR_LANGFUSE_PUBLIC_KEY>)
  secret_key: $(LANGFUSE_SECRET_KEY, <YOUR_LANGFUSE_SECRET_KEY>)
  base_url: $(LANGFUSE_URL, https://82.157.193.13:10102)

Bug提交账号、langfuse的key等，会在活动正式开始时私信发送，如有任何疑问请联系群主。

抛砖引玉

案例（一）

思路：由于已经提供了功能全部正常的Origin版本RTL，因此可以基于Origin版本收集测试用例，然后基于有Bug版本的RTL进行回归测试。

关键步骤：

（1）构建 DUT

# 提前编译所有 DUT
make build_dut_cache

# 清空RTL文件内容，进行'黑盒验证'
echo "" > dutcache/VectorIdiv_origin/VectorIdiv/VectorIdiv.v

（2）收集正常DUT的测试用例

# 提前完成iFlow认证，选好模型 GLM 4.6
npx -y @iflow-ai/iflow-cli@latest

# 关闭测试用例模板强制Fail检查来进行UT验证
TEMPLATE_MUST_FAIL=false make run VTARGET=origin_file/VectorIdiv_origin.v

上述UCAgent全自动验证过程持续约3个小时左右。

（3）检验测试用例

# 进入用例目录
cd output/62665/unity_test/tests

# 运行测试
pytest

# 得到类似输出
...
collected 139 items
test_VectorIdiv_boundary_handling.py ..................
test_VectorIdiv_configuration_control.py ..........
test_VectorIdiv_pipeline_control.py ..................
test_VectorIdiv_stage19_complete.py ......................
test_stage21_verification.py ......
===== 139 passed, 2 warnings in 132.64s (0:02:12)

（4）替换DUT，进行回归测试

cd output/62665/

# 删除Origin版本的DUT
rm -rf VectorIdiv

# 链接有Bug版本的DUT到该目录
ln -s ../../dutcache/VectorIdiv_bug_1/VectorIdiv .

# 再次运行测试
cd unity_test/tests
pytest

# 获得类似以下输出
...
collected 139 items

test_VectorIdiv_boundary_handling.py FF................
test_VectorIdiv_configuration_control.py ..........
test_VectorIdiv_pipeline_control.py ..................
test_VectorIdiv_stage19_complete.py ....................FF...
test_stage21_verification.py ....F.
=== FAILURES ...

（5）Bug分析

发现替换DUT后有5个Fail，其中一个如下：

...
env = <VectorIdiv_api.VectorIdivEnv object at 0x73a61c23cfd0>

    def test_divide_by_zero_detection(env):
        """测试除零检测功能"""
        # TODO: 测试能够正确检测除数为零的情况
        env.dut.fc_cover['FG-BOUNDARY-HANDLING'].mark_function(
          'FC-DIVIDE-BY-ZERO', test_divide_by_zero_detection,
          ['CK-ZERO-DETECTION'])

        # 测试除零检测：使用32位精度，被除数100，除数0
        try:
            result = api_VectorIdiv_divide(env,
                        dividend=100,
                        divisor=0,
                        sew=2,
                        sign=0, timeout=200)
            # 如果没有抛出异常，检查d_zero标志位
            status = api_VectorIdiv_get_status(env)
            assert status['flags']['d_zero'] != 0, "除零时d_zero标志位应该被置位"
            print(f"除零检测成功，d_zero标志位: {status['flags']['d_zero']}")
        except TimeoutError:
            # 超时也是可以接受的，因为硬件可能在处理除零
            status = api_VectorIdiv_get_status(env)
>           assert status['flags']['d_zero'] != 0, "除零时d_zero标志位应该被置位"
E           AssertionError: 除零时d_zero标志位应该被置位
E           assert 0 != 0

test_VectorIdiv_boundary_handling.py:21: AssertionError

上述测试用例中的Assert明确说明了d_zero在除0时没有正确赋值，与spec不符可确定为Bug。

其他

可以使用任何 LLM，开源或者商业
可以使用任何 Code Agent，例如 Claude Code、Gemimi CLI、TRAE等
如果发现Origin中相同的Bug，先提交者获得奖励

~~关于取得更好结果的碎碎念：~~

例子中的Spec给的太简单了，我能否给更完整的Spec呢？例如IEEE的标准，NEMU中的C代码实现等。
UCAgent API模式中，原有的Context管理也简单，简单优化就可能提升个10倍效率。
既然都是注入Bug，我是否可以提前用Origin版本生成大量的测试用例，当发布bug的时候直接替换Python包快速跑出Fail用例，先人一步。
我可以先通过MCP的方式把Bug都跑出来，然后把Bug描述给LLM去用API模式跑效率赛道，这样时间代价更小。
既然例子中提供了Batch执行模式，我可以让LLM晚上连续工作，我白天分析其结果。
LLM存在随机性，每次跑出的结果都不一样，因此可以多跑，充分发挥“随机性”在验证工作中的作用。
为何用iFLow作为例子呢？因为它API免费，国内开源大模型几乎都有：GLM 4.6, Qwen3-coder, MinMax M2，Kimi-k2 thinking 等。
使用更强的模型，对于一些商业模型，训练数据中就包含了 RSIC-V 的 Specification，不给完整spec也能发现bug。
DUT的功能明确，接口简单，如果此时Verilog文件太长或者复杂(例如混淆)，则可清空对应RTL内容避免给LLM上下文带来负担。
听说学生党可以申请 Copilot 教育计划，白嫖 Claude 4.5, GPT-5.1-Codex 等前沿模型（王炸组合：UCAgent-MCP + Copilot CLI + Claude 4.5）
有些bug和设计实现，以及具体使用操作相关，在Spec中不一定有描述
LLM 有时候会欺骗你，为了通过Check假装完成了任务，这个时候需要及时人工介入，最好重新开始（一旦它尝试走捷径，结果将变得不靠谱）
长时间工作时，非必要不建议盯着LLM的工作过程，很可能会看它太傻而忍不住终止任务（很多时候它需要经过多次尝试才能找到解决方案）
可以根据需要，定制config文件，修改Guid模板
人机协同能发现更多的bug（聪明的LLM很多时候想的是如何骗过Checker而不是完成任务，此时需要人工检查/交互，LLM更关注人的输入，而不是MCP工具返回的Message）
如果确定/怀疑某个地方有bug，可以通过提示词（或者验证输入文档）指定需要重点验证的方向/功能/模块
可以把LLM当成一个容易犯错的实习生去对待，让它完成重复无挑战的事情，然后基于它的成果进行人工完善

Name		Name	Last commit message	Last commit date
Latest commit History 54 Commits
bug_file		bug_file
final_result		final_result
origin_file		origin_file
spec		spec
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md
黑客马拉松解题经验分享-251207-2.pdf		黑客马拉松解题经验分享-251207-2.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

2025-12 万众一芯黑客马拉松（第一期）

赛道介绍

本仓库介绍

安装依赖

开始运行

成果提交

找Bug赛道

效率赛道

额外奖励

提交地址

抛砖引玉

案例（一）

关键步骤：

（1）构建 DUT

（2）收集正常DUT的测试用例

（3）检验测试用例

（4）替换DUT，进行回归测试

（5）Bug分析

其他

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

Languages

XS-MLVP/hackathon2512

Folders and files

Latest commit

History

Repository files navigation

2025-12 万众一芯黑客马拉松（第一期）

赛道介绍

本仓库介绍

安装依赖

开始运行

成果提交

找Bug赛道

效率赛道

额外奖励

提交地址

抛砖引玉

案例（一）

关键步骤：

（1）构建 DUT

（2）收集正常DUT的测试用例

（3）检验测试用例

（4）替换DUT，进行回归测试

（5）Bug分析

其他

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Languages

Packages