Ai杂谈（2）请教支持向量机用于图像分类.

请教支持向量机用于图像分类
发信站: 水木社区 (Mon Jul 9 14:10:46 2007), 站内

我打算做些图像分类方面的事情，有人指路说现在支持向量机的研究比较热，也有些拿来做图像分类的，看了一些文章后感觉即使用SVM的方法来分类，但似乎关键还是在于图像特征的提取，如果提取的特征很好，其他的分类方法一样可取得很好的效果，最多就是在最初样本积累或者特征比较多的高维情况时，SVM有些优势。

我原本以为SVM有很大一套理论，但现在总的感觉就是SVM方法其实内容不多。思路就是找支持向量（认为只有在一类模式边缘的样本才对分类超平面的构造起作用），然后非线性映射转换到高维空间构造一个线性的分类超平面，这种非线性映射通过核函数的方式实现，通过内积运算来描述正负样本之间或者是样本与待分类模式之间的相似度，也减少了运算复杂度。然后就没有了……

由于现在了解得不深入，对整个模式分类领域的方法也不怎么了解，所以只有上面这些认识，希望能有人指点指点迷津，我主要是觉得SVM被捧得挺热，但一看觉得单纯应用的话也就上面一点思路，好像创新的话就是在核函数的构造以及参数的选择方面，总觉得内容比较少，与我直观想象的有些差距。

另外各位能否讲讲其他模式分类方法的大体思路？
--
Re: 请教支持向量机用于图像分类
发信站: 水木社区 (Mon Jul 9 18:43:53 2007), 站内

feature extraction和learning framework是image classification的两大重点
特别是前者
而svm作为分类器来讲不是这里的关键
plus：svm早已不像你说的那样热了，呵呵
Re: 请教支持向量机用于图像分类
发信站: 水木社区 (Mon Jul 9 19:43:16 2007), 站内

semi-supervised learning

【在 mirror (mirror) 的大作中提到: 】
: 现在热的是？

Re: 请教支持向量机用于图像分类
发信站: 水木社区 (Mon Jul 9 21:24:44 2007), 站内

如果能得把统计学习里面的容量控制，等价类，VC维的理论搞懂了，那现在做有关svm或
者统计学习领域的研究都很有前途，不然，只能搞些应用而已，若干年前就没剩下东西
了。

Re: 请教支持向量机用于图像分类
发信站: 水木社区 (Mon Jul 9 22:23:37 2007), 站内

图像分类这个应用是比较宽泛，从偏应用的检索，到计算机视觉中的object recoginition,现在很热的generic object categorization。但SVM在确实是这里面最好用、效果最好的方法之一，但是如果没有新的东西加进来，就很难发表。如果刚开始做，就先把SVM用熟吧。然后再看以下譬如CVPR07的那个object recognition的tutorial。调研现在好用的特征有哪些，有什么特点。是全局的，还是局部的，等等，一般用什么学习方法。但是好多CV的工作还只能做做toy问题。
Re: 请教支持向量机用于图像分类
发信站: 水木社区 (Mon Jul 9 22:41:38 2007), 站内

我感觉lifiefei他们作的是不是有点虎人呢>?

例如他的一个使用LDA做自然景物分类的,里面学习的过程,论文里面说马上给出,结果一直也没有.

ps:你认为局部不变特征点是不是可以解决一下,遮挡啊尺度,视角等问题呢>?

感觉不错.
后面就是learning framework的问题了.貌似很多人做里面的框价,学习问题吧.
不过感觉就是比较虚啊.

好象那个pascal还做了个分类的测试,大家把自己算法放上去测试.

有点乱,随便聊吧
Re: 请教支持向量机用于图像分类
发信站: 水木社区 (Mon Jul 9 23:02:48 2007), 站内

都没有尝试过，所以不好评价。

感觉lifeifei做的工作都不work，但是idea不错，包括类似的LDA,星云模型等，但都是不错的探索。

局部的具有某种不变性的特征点，有挺长时间历史了，发展到SIFT好像到了极致，后来又有一些仿射不变性的特征点，好像没有广泛应用。好像还有人做实验（ECCV?)，称interest point is random point。

关于学习，也有很多的模型，综合利用appearance evidence和geometry or spatial layout constraints. 很多实验都是在非常小的、简单的数据集上实验，应该挺有意思，但还没不能看到scalable的希望。

现在类似的评测挺多，例如PASCAL,还有一些标注区域数据集的尝试，例如peekaboom@cmu,labelme@MIT。

我不是做CV的，做图像检索，更接近应用层次，试图做可应用的、更好精度的图像自动标注方法。
Re: 请教支持向量机用于图像分类
发信站: 水木社区 (Tue Jul 10 12:40:50 2007), 站内

你也是元老了，应该对这俩领域很清楚啊:). 本来做图像检索的和计算机视觉的两拨人没有什么关系，但是最近在逐渐靠近。

经典的content based image retrieval从来没有像CVer那样去试图理解图片的语义，只是利用低层特征的相似性，让计算机辅助人们更快更好更准的找到图片，但是存在所谓的semantic gap。现在做图像检索的人逐渐、已经开始向CV的套路靠近，有的名字叫图像分类、图像自动标注等等，使用机器学习的方式建立起底层特征和某些语义概念之间的联系。

CVers从来都认识到general object categorization是很难的，所以做特定的object recognition很流行，人脸，指纹，建筑。。。，但是好像近几年做一般的物体识别挺热的，并且比较关注大规模的数据集上的验证，做的人挺多的，能数出来好多鼎鼎大名的人，MIT有个报告称这个题目是视觉里面的圣杯(holy grail)之一。去年有本书出版，好像叫towards general object categorization，总结了近些年这方面的进展。

Published on Jul 10, 2007 in categories

上一篇非完整约束
下一篇 Ai杂谈（3） dodo：人脸识别方法个人见解(zz from prfans)