新词发现

新词识别

看参考中的:

互联网时代的社会语言学:基于SNS的文本数据挖掘

这篇文章应该最早提出凝固度和自由度的文章了吧!后续的都是拿人家的文章说事…!很多人这么说机器学习多简单啊,knn就那么回事(心中无数个××飞过!)   

凝固度 

	就像人群中你遇到几个人一起走道,你不确定他们是不是朋友,你碰到好多次都是他们一起走道!高于很多人偶然相遇的概率,从这点上说,这几个人是朋友的概率很大!
	凝固度:
		就是出现的概率非常高于偶然间的相遇!

自由度

	基于上面那点可以大概确定他们是朋友,但是你只在一个地方碰到,就有点悬了,比如在地铁上,就是俩习惯相同的人;所以你要是在不同的地方都见到他们,那么你可以断定,他们是朋友了!
	自由度:
		用信息论中的熵讲的:
			左右临字是否多样性!

参考

Fork me on GitHub