人工智能人脸识别技术在直播平台客户端的应用和优化

作者:Quan Yin

介绍

DLPAT (Deep Learning People Analytic Technology)是在英特尔平台上使用了深度学习技术的计算机视觉SDK。DLPAT可以应用于一 些中国直播行业的软件中,为在这些平台上现场表演的主播提供增强的视觉效果,如增加脸部的美颜,增加实时虚拟换装等。

为了提高人脸识别的准确性,我们采集了大量来自互联网和软件合作伙伴的面部图片,并为了进行深度学习训练对这些数据进行标记。每幅图像的68个面部特征点由工具自动标记后由人工进行微调。 累计标记了一万张面部图片,并使用这些数据加上包含了数百万标记的图片为原始数据来训练深度学习模型。 然后通过深度学习技术对模型进行改进,提取面部标志点特征点,提高精度。

在使用新的标记数据集训练深度学习模型之前,由动态检测的面部特征点有明显的抖动,这是客户所不能接受的。 经过优化后,脸部提取的特征点更加稳定。 抖动的问题得到了改善,能够运用在实际工程中,得到了客户良好的反馈。

性能比较

  • DLib – 使用传统的视觉算法
  • DLPAT – 使用深度学习方法

表格中的数据是基于Intel Core i7 i7-6770H在Windows 10平台上进行的测试

  1. 标准化的平均对齐误差/眼球间的距离分别低于5%, 10% 或 15%的时候:通过标准化的平均对齐误差/眼球间的距离来判断多少误差被控制在5%(10%,15%)。 这是一种通常的统计学方法
  2. 平均绝对百分比误差:MAPE

从这个表格中,我们可以做如下总结:

  • 使用深度学习技术的DLPAT比使用传统视觉算法的DLib在校正平均对齐误差方面具有更好的性能
  • DLPAT中发生的平均误差次数少于DLib中的次数

基于升级后的DLPAT SDK, 独立软件开发商可以整合到其产品以提供以下功能:

测试程序

  • 开启landmark.exe。这个应用程序将开启两个窗口显示优化后的结果和原来的结果。这样可以动态地比较出优化后的效果
  • 从优化的解决方案来看,可以发现动态检测到的面部特征点的位置比原来使用计算机视觉解决方案更稳定。

点击图片查看大图

  • 打开标记工具网站,标记的信息将被显示在网页上

点击图片查看大图

附加信息

DLPAT 架构

DLPAT 特性

DLPAT基于Intel IA平台提供了以下功能:

  • 基于人脸的个人信息识别
  • 基于人脸的年龄识别
  • 基于人脸的性别识别
  • 基于人脸的种族识别

总结

DLPAT利用人工智能技术为客户提供了在英特尔客户端平台上的人脸识别解决方案。通过增加使用标记工具标记的人脸数据,提高了对现实场景人脸识别的准确度, 从而帮助客户解决了问题。

有关编译器优化的更完整信息,请参阅优化通知