本周工作思考
渤健uShow渤健项目开发总结
之前负责过一套uShow的开发交付,这次第二次是完整的跟进项目开发过程,这次比上一次的困难一下,第一次是我认为是客户的提供的数据比较有代表性,学员演进的内容和客户给到的product和fab比较贴合,所以特性文本很很容易抓到。这次客户的给的总数据有37个视频,方差在3左右,就是各个视频的专家打分波动非常少,最高90,最低84,这些数据不好找明显特征,需要不断的在高分视频的逐字稿中寻找更匹配的知识点和fab的说法,同时又要兼顾客户要求的训练目标中的product和fab,这两套总共分析了80次左右,整体打分的相关性在0.6-0.7之间,按照经验,应该能够符合客户专家的打分习惯,又能够甄别出符合product和fab表达要求的视频。
这次项目我也尝试总结一套可复制的操作方法,希望按照这个方法操作就能够得到较好的特征文本和拟合特征。如果有了这样的方法我们就可以工程化的手段提高交付效率。目前以我的经验来看,还没有没有找到这套方法,可能有3个原因,1是ushow的理解度还是不够深刻,对单个ai技术有些掌握了,但是这些技术组合起来的效果的本质还是模糊的,这样就不能把握特征点的选取方向, 2是经验太少了,根据现在的经验没法联想和推导更多未知的情况。3是不同的企业的学员对产品点讲解和fab的讲解似乎是不一样的。通过以往的数据看,有些企业的学员有很好的产品点意识,会完整的说完产品点,中间穿插灵活的举例,引申,解释等等,有些企业的学员把产品点分散到这些举例,引申里,ai的判断的上下文容量有限,就不太能够得到完整的产品点。