["首页","博客标签","我","开源","深度学习","机器学习","自然语言","爬虫","编程","开发语言","前端开发","生活","论文","关于me"]
工作5年接触过的项目
作者: IntoHole | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址: http://www.buyiker.com/2016/11/26/work-life.html
我的实习经历
- 大三的时候,那个暑假没有回家,当时本想参加齐鲁软件大赛(5个人参加,后来我为了不浪费钱,一个人抠图,编码,设计,写了三个基于objc的游戏),我当时李老师,带着我去了北京,参加一个objc聊天项目重构,据说他们自己都不知道代码怎么写的,一片混乱,我那个老师太nb了,直接去重构,以前都是写c(用c写一些自认为很帅的小游戏,荒废了大学那么美好的时光),自己在北京呆了十几天,见了一次同学;没怎么感受北京的拥挤,期间就是写一些小代码,阿弥陀佛,当时认为我是实习的,所以没有正点上过班,那时认识过几个同事,后来,也失去了联系,实习完毕之后,在天津和北京逛了几天,坐火车回到学校,期间见义勇为一次;
- 大四,上学期都是在学校机房混的,悲催的机房居然搬迁,重新弄~苦力啊!不过那段时间挺好的,自己写程序,跟刚子一起吃饭,挺爽的;
- 大四下,12月末,李老师(我感觉贵人啊),把我弄进南京某研究所,写军用软件,我属于某坐席的开发,天天写着mfc,期间是马经理带我,一个非常有意思的人,每天,我都跟着他屁颠的走,里面都是军人开发,住着宾馆,吃着自助,过着每天寝室,餐厅,公司三点一线的生活,那时候看了几本c++的书籍(我没学过什么c++),之后,就开始开发了,写了几个功能,看着自己写的功能在那个大型指挥系统运行,感觉超帅!
- 感觉实习的公司太高大上,在自己没有想清楚的时候,辞职,回学校,重新找工作,在朋友家呆了一段时间,接了四个offer,选择一家创业公司进入了,坐舆情分析,第一份正式工作,公司我是第6个进去的,两个经理,其它的同事都是刚毕业的,我第一个任务研究新浪微博api怎么可以无限抓取,通过我几天的研究,我成功绕过了他们的限制,用最小的成本抓取新浪微博,一天我们当时抓取一亿以上的微博(这个爬虫我们不知道优化回了),因为公司刚成立,我们每个人研究一些东西,我研究的是热点事件~,之后开始不断看论文(英文,一阵痛感),最后找到一个基于小波变化的挖掘爆发的热点事件(一个事件的爆发是n个词爆发,不是孤立的,原理就是如此),写了第一版上线,当时感觉不错,之后做了一个情感意见挖掘的(其实用了skip-gram思想,当时不知道,人说话的方式是相同的,只是其中词的顺序不同而已),后面,就是开发爬虫整体部件,后面跟了一个苏州大学机器学习毕业的人,开始弄相关的方向(最大熵模型/贝叶斯/svm)各种模型,各种nlp处理工具,后来,因为一些事情,我离开那个公司,喜欢那段时光(自己定位是什么),感觉要抓取自己的业务深度挖掘
- 后来去了一个金融公司,经理很赞,脾气好,里面的生活主要是看paper。。。,之后研究各种机器学习模型(基于语义的),中间写了一个自动摘要第一版,后来他们改进,加了人工规则,替代原有人工摘要,节省了很多劳动力(很晚了,待续)