toklabel:星环聚能和清华大学合作推出的开源聚变数据标注平台,加速聚变AI应用
公司新闻2025-06-20 18:08:00 全部新闻 >

高质量标注数据的缺失越来越成为制约AI发展的瓶颈,聚变领域更是如此:美国能源部报告指出,聚变AI相关研究者常耗费70%的时间在数据整理环节。针对此痛点,星环聚能和清华大学近日合作推出了基于Label Studio的开源聚变数据标注平台——toklabel,希望借此显著提高聚变数据的标注效率,推动聚变数据标注的标准化与协作化,加速AI在聚变研究中的应用,更快地实现聚变能。

toklabel遵守Apache2.0协议,欢迎大家自由使用,也欢迎大家反馈意见或贡献代码。

高质量标注的数据加速AI赋能聚变

聚变能开发正迎来AI技术驱动的变革时代,但高质量标注数据的缺失一直是制约各类AI模型性能提升的关键瓶颈。虽然在文字、图像和视频等领域已经有很多标注工具,但聚变领域的数据标注工作大部分仍处于“刀耕火种”阶段。这是因为一般标注工具往往功能单一、扩展性有限,没有针对聚变特有的以“炮”为单位的多模态数据(如时间序列、图像等)提供便捷统一的管理方案。

针对聚变领域迫切的需求,toklabel解决了以下问题:

多模态支持:支持一维(时间序列数据)、二维(高速相机等)数据标注,满足聚变诊断和感知数据的多样化需求。 

高效存储设计:结合PostgreSQL与Redis,实现标注结果的结构化存储与快速检索,为后续模型训练提供便利。 

智能辅助标注:集成参数化标注、AI预标注(如Time-Series Transformer)等功能,显著提升标注效率。 

toklabel实操展示

  • 时间序列标注:放电特征时间项目

1.输入炮号自动生成数据并导入label studio,以下三个时序数据。

2.模型自动预测三个特征时间(击穿、破裂、结束),给人工标注提供参考。

3.自动根据人工标注的结果进行模型训练。

  • 图像标注:基于可见光的等离子体位形标注

根据等离子体位形参数进行最外闭合磁面的标注

共建生态:呼吁行业协作,完善数据标准

toklabel的开源将有效降低聚变研究者整理数据的时间,并提高数据标注效率。全球聚变研究者均可免费使用这一工具,并支持团队协同标注。

开源只是起点,而非终点。作为初期版本,toklabel仍需持续迭代。星环聚能期待与同行携手,一起建设适配聚变领域的数据标注和管理系统,共同探索AI与聚变融合的无限可能。


立即访问toklabel:[GitHub链接] https://github.com/STARTORUS/tok-label


联系我们
电话:029-86041002
邮箱:business@startorus.cn
公司地址
地址:陕西省西安市高陵区北方智造2-22陕西星环聚能科技有限公司
关注我们
扫码关注星环聚能服务号
©2023 陕西星环聚能科技有限公司 版权所有 陕ICP备2023001255号-1