填补空白!CES团体标准《电力人工智能样本增广技术架构要求》

科技有电还接地 2024-09-13 18:58:35

中国电工技术学会团体标准T/CES 277-2024《电力人工智能样本增广技术架构要求》由中国电工技术学会提出,国家电网有限公司大数据中心、国网信息通信产业集团有限公司、中国电力科学研究院有限公司等单位起草编制完成。该标准规定了电力人工智能图像类样本增广、文本文档类样本增广和音频类样本增广等方面技术要求。

1. 标准起草单位及主要起草人

(1)起草单位

国家电网有限公司大数据中心、国网信息通信产业集团有限公司、中国电力科学研究院有限公司、国网智能电网研究院有限公司、安徽继远软件有限公司、国网福建省电力有限公司、国网(北京)综合能源规划设计研究院。

(2)主要起草人

李强、赵峰、邱镇、陈振宇、李博、李杏、张鹏宇、张帆、李炳森、黄晓光、王琪媛、张琳瑜、秦余、王晓东、张国梁、周逸平、苏勇等。

2. 标准制定背景

目前电力人工智能面临着样本数量不足和质量参差不齐、模型泛化能力不足和架构设计不规范等问题,具体为:

1)在电力人工智能领域,训练样本的数量和质量对模型的准确性和泛化能力有着至关重要的影响。由于电力行业的特殊性和复杂性,收集到的训练样本往往数量不足、质量参差不齐,这给模型训练和测试带来了很大的困难;

2)电力人工智能模型在训练过程中往往会出现过拟合和欠拟合的问题,导致模型在测试集上的表现不佳,泛化能力不足。这主要是因为训练样本的数量和质量、模型复杂度、训练时间等因素的影响;

3)电力人工智能样本增广架构设计是影响样本增广效果的关键因素之一,目前电力人工智能样本增广技术的架构设计往往缺乏规范和标准,给行业应用和推广带来了一定的困难。

通过规定电力人工智能平台中样本增广技术的架构设计、技术要求和评估指标,提高电力人工智能模型的泛化能力和准确性,促进电力人工智能样本增广技术的标准化和规范化。

3. 标准主要内容

(1)范围

本标准规定了电力人工智能样本增广技术总体架构、图像类样本增广技术、文本文档类样本增广技术和音频类样本增广技术等相关技术,并对样本增广效果评价、样本增广策略制定、样本增广算子编排技术和功能作出要求。

本标准适用于电力人工智能图像类、文本类、音频类等样本的增广。

(2)规范性引用文件

本文件没有规范性引用文件。

(3)术语及定义

主要包括电力人工智能、电力人工智能样本、噪声、语音识别、信噪比、峰值信噪比、感知语音质量评价、平均主观评分和样本增广算子等定义。

(4)缩略语

主要包括OCR、GAN、SNR、PSNR和PESQ等缩略语。

(5)电力样本增广技术总体架构

主要对电力人工智能样本增广技术总体架构和电力人工智能样本增广技术做出规范。

(6)电力图像类样本增广技术

主要规范了基本图像增广、混合图像增广和虚拟图像生成等内容。

(7)电力文本类样本增广技术

主要规范了标签无关增广方法、标签相关增广方法和用于OCR文档的样本增广技术等内容。

(8)电力音频类样本增广技术

主要规范了回译技术、词汇替换技术、随机噪声引入技术和生成式的方法等内容。

(9)电力样本增广效果评价要求

主要规范了电力样本通用评价、图像类样本增广效果评价、文本类样本增广效果评价和音频类样本增广效果评价等内容。

(10)电力样本增广策略制定要求

主要规范了样本增广目标、样本增广算子选择、样本增广算子顺序、样本增广程度和样本增广随机性等内容。

(11)电力样本增广算子编排要求

主要规范了可扩展性、并行性、容错性、数据流管理、优化和调度、可视化管理等内容。

4. 标准制定效益

标准制定填补了电力人工智能样本增广技术领域标准的空白,规范电力人工智能样本增广技术架构设计,提升电力人工智能样本增广效果和电力人工智能模型的泛化效果。

0 阅读:0

科技有电还接地

简介:感谢大家的关注