本周工作思考
渤健uShow建模
ASR数据准备和流程清理都很顺利,单项数据拟合不是不顺利。儿童领域的训练数据的开场白的专家打分和AI打分的拟合度不一致,AI打分的方差较大,比如有些学员的开场白缺少感谢的话,缺少明确的自我介绍,AI评分为0,但是专家整体上给分还是比较高,这种处理上就需要从整体分数上做补偿,所以不能太专注于打分细项的分数,目标是整体的打分拟合专家的打分。这个我在开始没有特别注意这一点,还是比较在意这些细项,实际实施起来难度较大,所以转换思路,先整体拟合,然后细项调优,包括配置调优和计算参数调优,然后在整体拟合。结合这周的经验和思考。下周用这个思路继续做下面的工作。
测试环境和训练目前都是基于人工把流程串联起来,辅助工具和评测,经验沉淀还没有固化成模式和平台,这其实很难定量的评估模型结构,这个作为重要的基础能力一定要构建起来,对于AI垂直类产品,需要突出三个产品工程优势,1是AI产品功能定义和业务融合,2是AI技术能力整合,3是AI功能测评和调优(反馈),第一个优势来自我们对行业的深刻理解对从业人员需求的细致把握,九年摸爬滚打的积累,我们天然的具备这个优势,这个我认为我们已经具备,现在要做的就是巩固和产品化,第二个我们对AI技术有了初步的工程应用和技术整合能力,比如我们初步构建起来AI技术的应用框架,也具有一些适合自己的开发模式,但第三个是我们目前的短板,同时这个也是最关键的,我们在未来的几个OKR周期里要逐渐构建起来。