第1811章 哥,你什么时候来的?(1/2)
晨光不是一下子泼进来的,而是像一种极淡的、掺了灰的柠檬黄,先洇湿了东边天际线那些锯齿状的屋顶与教堂尖顶,再缓缓漫过阿勒格尼河面尚未散尽的、牛奶般的雾气。
曹鹏租住的肖雷镇一栋老砖墙公寓楼的顶层,朝东的窗玻璃上,爬山虎肥厚的叶子将光线滤成细碎而晃动的绿斑,在他合着的眼皮上温柔地骚动。
五点四十七分,比闹钟早了十三分钟,他的生物钟精确得像经过梯度下降优化过的算法。
躺着没动,闭眼在脑中复盘昨晚推导到一半的稀疏表示模型。那些符号在黑暗里自动排列组合,如自律的士兵。三分钟后才睁开眼,起身,赤脚踩在微凉的地板上。
单人床、书桌、书架、三台并排的显示器、地板上蜿蜒的数据线缆和摞起来的专业期刊,构成了这个不足十五平方米空间的全部秩序,被曹鹏整理得像一篇逻辑严谨的论文。
窗台上的那盆绿萝在晨光中舒展着肥厚的叶片,这是曹鹏从学校实验室里救回来的,如今已蔓生出近一米长的气根,像一道绿色的瀑布垂着。
书桌左边堆着三摞论文打印稿,每摞都用不同颜色的便利贴做了标记:蓝色是待精读,黄色是需要重验推导,红色则是存疑待讨论。一台显示器上开着一个终端窗口,一行行代码正以某种催眠般的节奏向上滚动。
书架按领域分层,最上层是统计学习理论经典,中层是近年顶会论文集,下层是些“杂书”,《庄子》、《围棋定式大全》、《哥德尔、艾舍尔、巴赫》。
拉开那扇有些滞涩的窗户。匹兹堡夏日清晨特有的空气涌了进来,并不清新得过分,带着河流的水汽、远处尚未关闭的钢厂一丝微弱的硫磺暗示,以及这个老工业城市在清晨舒展筋骨时呼出的、混合了砖石、沥青和茂密植被的复杂体味。
远处,卡内基梅隆大学校园那些现代与古典杂糅的建筑轮廓,在渐亮的天光中逐渐清晰。
一个深呼吸,走到小厨房,烧水,从铁罐里捏出李乐给的剩的不多的茶叶。等待水开的间隙,他做了一套自创的“唤醒操”,其实只是缓慢转动颈椎和肩关节。
长期编程的人,颈椎是阿喀琉斯之踵。水沸了,冲茶,看蜷曲的叶片在玻璃杯里舒展成完整的春天。
六点整,曹鹏坐到电脑前,先花十分钟浏览arxiv上新挂的预印本。此时计算机视觉领域正处在变革前夜,支持向量机仍是主流,但已有零星论文开始讨论“多层神经网络”在图像识别上的潜力。
他快速扫过摘要,标记出三篇值得细读的,拖进待读文件夹。这个动作他做了四年,文件夹如今有11着一沓打印稿,鼻梁上架着那副标志性的半框眼镜。这位图灵奖得主今天穿了件浅蓝色的牛津纺衬衫,袖子挽到手肘,露出小臂上浓密的汗毛。
“曹,你的报告在第三个,”瑞迪头也不抬地说,“我希望看到完整的误差分析,而不仅仅是准确率数字。”
“明白,教授。”
曹鹏坐到最边上,从包里取出笔记本电脑和一份打印好的资料。他习惯纸质备份,在这个pdf和powerpoint已经普及的年代,这显得有些老派,但他喜欢在汇报时用铅笔快速标注重点的感觉。
组会准时开始。第一个汇报的是博士三年级生艾米丽·陈,一个除了姓氏,其他各方面已经和华裔都不沾边的女生,包括长相,毕竟,作为第一批来到丑国的华工后代,你要相信基因的力量。
她做的是基于主动轮廓模型的医学图像分割。汇报到一半时,瑞迪打断了她。
“你的能量函数中正则项系数是固定的?”
“是的,目前是0.3。”
“试过自适应调整吗?根据图像局部梯度?”
艾米丽愣了一下,“这……会增加计算复杂度。”
“先验证有效性,再优化效率。”瑞迪的语气平和,却带着不容置疑的权威,“下周三之前,给我三组对比数据。”
曹鹏低头在自己的笔记本上快速记下一行字,“正则项自适应,可用于多尺度特征权重分配?”他的思维总是这样,即使在听别人的汇报,也会下意识寻找与自己课题的交叉点。
第二个汇报的就是胖子维杰。
他提出了一种基于互信息的特征选择方法,用于降低高维特征空间中的冗余。
汇报过程中,曹鹏三次举手提问,一次关于互信息估计中核函数带宽的选择依据,一次关于该方法在类别不平衡数据集上的鲁棒性,还有一次关于计算复杂度的实际评估。
每次提问都朝着要害而去。维杰的回答起初还游刃有余,到第三个问题时,额头已渗出细密的汗珠。
“计算复杂度方面,”维杰翻动着幻灯片,试图找到相应的分析页面,“理论上是o(n2),但实际实现中我们采用了近似算法……”
“近似算法的误差界是多少?”曹鹏追问。
会议室安静了几秒。瑞迪抬起头,目光在两人之间扫过,嘴角似乎微微上扬了一毫米—,这是他对学生间高质量辩论的认可。
“这……我们还在分析。”维杰最终承认。
“那么在你的实验结果中,至少应该标注‘使用近似算法’的说明。”曹鹏的语气没有得意,只是陈述事实,“否则对比是不公平的。”
维杰点头坐下时,曹鹏对他眨了眨眼,这是两人之间的默契,辩论归辩论,不影响午饭时一起吐槽系里新出台的服务器使用规定。
瑞迪教授朝曹鹏点头,“上周我们讨论了sift特征在动态场景中的漂移问题。曹鹏提出了一个新框架的初步想法。今天,请他详细展开。”
曹鹏起身,在靠近白板的位置坐下,他没用投影,有些思路,手写更能体现思考的脉络。
“谢谢教授。”他转向小组,目光扫过每个人的脸。
维杰抱着手臂,眉头微皱,艾米丽已打开笔记本,二年级博士生汤姆眼神放空,大概还没从昨晚的dota战中回神,而博士后捷尔任斯基,则冲曹鹏眨眨眼。
“我们现有的图像分类流程:特征提取、编码、池化、分类器。”曹鹏画了四个方框,“问题在于,手工设计的特征,比如sift....在类别增多、视角变化剧烈时,区分度下降。而编码阶段用的k-means或稀疏编码,本质是假设特征服从单一分布。”
说到这儿,他等等,看是否有人提问。维杰动了动嘴唇,但最终选择放弃。
本章未完,点击下一页继续阅读。