OSI,即为开放系统互连(OSI)模型,它定义了一个网络框架,以在七层中实现协议。OSI模型实际上没有任何内容,事实上上,它甚至是无形的。OSI模型在联网过程中不执行任何功能。它是一个概念框架,以便我们可以更好地理解正在进行的复杂交互。
以在线社区留言为例,为了不影响社区的发展,我们要屏蔽侮辱性的言论,所以要构建一个快速过滤器,如果某条留言使用了负面或者侮辱性的语言,那么就将该留言标志为内容不当。 过滤这类内容是一个很常见的需求。 对此问题建立两个类型:侮辱类和非侮辱类,使用1和0分别表示。
对于分类问题,其实谁都不会陌生,日常生活中我们每天都进行着分类过程。例如,当你看到一个人,你的脑子下意识判断他是学生还是社会上的人;你可能经常会走在路上对身旁的朋友说“这个人一看就很有钱。”之类的话,其实这就是一种分类操作。
我的朋友海伦直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不限人选,但她并不是喜欢每一个人。经过番总结,她发现曾交往过三种类型的人: 不喜欢的人魅力一般的人极具魅力的人 实战案例 尽管发现了上述规律,但海伦依然无法将约会网站推荐的匹配对象归人恰当的类别。
K最近邻分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别。