作者
高春洋
编辑
向玉
还记得上学时来自后门凝视的恐惧吗?
有了AI,趴后门的班主任老师们终于可以歇了。
两个月前,杭州十一宣布将在教室中装上一套叫做「智慧课堂管理」的监控系统,由3个摄像头和一个桌面系统组成。它的监控范围不仅包括你的小动作,甚至还有你的面部表情!
熏疼现在的学生,和老师斗智斗勇,都要在微表情上下功夫了…
有了这套系统辅助,老师眼中的学生是长这样的↓
谁听得兴趣盎然,谁一脸嫌弃,在系统里全部一目了然。
“李雷同学,你丧着脸是觉得老师讲得不够精彩吗?”
Emmmmm…简直反人类!
你到底有多少种表情?
这套「智慧课堂管理系统」的要义就在于表情识别。
所谓表情识别,就是从静态图像或者动态视频序列中分离出特定的表情状态,从而确定你在认证听课还是开小差。
在「智慧课堂管理系统」中,学生的心理情绪被归为了7种表情——中性、高兴、难过/悲伤、愤怒、害怕/恐惧、惊讶和反感/厌恶。
换句话说,把漫画书塞到物理课本后面这招再也不灵了。
摄像头扫视全班,每个人脸上都写满了悲伤与厌恶时,你却一脸春光灿烂…对不起,你的表情出卖了你。
每个表情都有一套对应的面部变化。
比如,物理课的「官方指定表情」可能是这样的:
额头、眉角:眉毛内角皱在一起,抬高,并带动眉毛下方的皮肤眼睛:眼内角的上眼皮抬高脸的下半部:同时嘴角下拉,同时可能因为被老师点名回答问题,而产生轻微的嘴角颤抖
根据Ekman和Friesen在年创建的人脸表情图像库,这些面部变化对应了典型的「厌恶」表情。
但如果此时摄像头眼中的你:
眉毛稍微下弯下眼睑下边有皱纹或者鼓起;鱼尾纹从外眼角向外扩张唇角向后拉并抬高;嘴张大牙齿露出;一道皱纹从鼻子一直延伸到嘴角外部;同时,脸颊被抬起…
AI:别装了,交出物理书后面的手机吧…
根据六种基本表情的面部表情特征定义,我们闲得蛋疼总结出了一份「最科学」的表情包清单:
当然,人的情绪千变万化,表情的复杂程度远不是上面几个模型就能概括的。
针对这个问题,年PNAS上的一篇研究中,提出了「复合表情」这个概念,指出多个离散的基础表情能结合在一起,构成复合表情。
比如,遇到物理考试蒙对答案这种意外的惊喜时,你的脸上,很有可能呈现出一种高兴+惊讶的表情混合体。大概……酱?
AI认表情,总共分几步?
表情识别与人脸识别的流程类似,主要分为以下几步:
01
图像预处理
由于图像采集的光线条件和角度差异巨大,因此在开始识别前,系统首先需要对图片进行预处理:图像的大小和灰度归一化,头部姿态矫正,图像分割等。目的是改善图像质量,消除噪声,为后序特征提取和分类识别打好基础。主要包括align,dataaugment,facenormalization等;
02
人脸检测
人脸检测目的是检测出要识别表情的人脸;
03
特征提取
将点阵转化成更高级别图像表述——如形状、运动、颜色、纹理、空间结构等,在尽可能保证稳定性和识别率的前提下,对庞大的图像数据进行降维处理。主要包括:基于灰度特征的特征提取、基于整体统计特征的特征提取、基于频率域的特征提取、基于运动特征的特征提取。
04
分类辨别
在提取到的特征基础上,识别出目标人脸的具体表情。
教你玩坏表情识别在线API
听了小编这么长的叨逼叨,你肯定想问,没点技术,难不成我还玩不溜表情识别了?
非也!其实打开你的手机,已经有很多APP能在拍照时检测出你的表情和面部特征,比如基于人脸识别的社交软件PolyGram,还有情绪识别音乐的落网emo,只是结果…一言难尽。
PolyGramAPP界面
落网emo音乐APP
如果想玩靠谱一点的,有几个开放平台可以来撩。小编一个没忍住,用你们老婆的照片来了波测试,看看各家的结果有何差异。
百度AI开放平台