TCP三次握手四次挥手都干了什么?
快排和插排的Java实现
知乎脚丫第四弹
《知乎脚丫第三弹》已经能把所需要的问题标题、问题的描述、问题的链接、评论者姓名以及评论(貌似评论爬去地还不太准确)打印在控制台上,这一辑运用Java的io库把所有的内容优雅地输出到本地文件中。
本地创建文件、写文件
既然要本地存储,那么首先本地得有地方放东西,这个地方就是文件。在本项目里先创建文件夹out,在创建outout.txt文件用来存储内容。
这里使用BufferedWriter缓冲区,通过BufferedWriter和FileWriter的链接,BufferedWriter可以暂存一堆数据,然后到满的时候再实际写入磁盘,这样就可以减少对磁盘操作的次数。这其实也是装饰设计模式的使用。
漫步人生路
看了2016.6.26期的韩国版《两天一夜》节目,每周更新,我也是一集不落。而国内的综艺节目,呃…大家都懂得,就是假和作,完全把观众当傻子。这期节目,主演们去了历史很悠久的梨花女子大学体验大学生的生活,这是大学特辑第2辑(ps:主演们有车太铉等,重要的是6个人都是男人)。其中有两段环节,最让我感动,更确切地讲,应该是触动灵魂,人生不只是工作,还有诗和远方。
知乎脚丫第三弹
整合代码,简洁明了
原谅我这个微强迫症患者,按朋友说得,这是病得治!哈哈,可我觉得还行哈,还蛮舒服的。刚开始就扯远了,为了爬虫抓取知乎发现页面上所有的问题,我写3个类,Spider
类——获取网页所有信息,及特定内容;Zhihu
类——封装类,存储问题标题、问题的描述、问题的链接地址、评论者名字、和所有的评论;Main
类——运行整个项目的启动类。其实还写了一个UnitTest
类——单元测试,测试某个方法或者模块是否正确。我觉得单元测试还是很有必要的,与其出错逐句找Bug,倒不如保证每个模块的正确,即便最后出错,也能快速定位到err的地方。
知乎脚丫第二弹
有了前一篇的Google首页logo链接抓取的经验,学会了怎样向网页发送GET请求、字符串存储整个网页源码、正则表达式的初级使用。在这些基础上,可以开始玩耍了。
需求:知乎发现页面上有编辑推荐、今日最热和本月最日的一些问题和回答。我们要把这些问题及问题的链接,还有回答给抓取下来。
知乎脚丫第一弹
这是在弄啥子嘞
想弄这个爬虫,抓一抓网页的信息这个念头,是前段时间面试阿里实习岗位的时候,一位资深面试官向我建议的。他觉得我理论层次达到,但是缺少实践的理解。所以最后也就不出所料的挂了。总结教训,吸取经验,决定要让自己对所学、所识的玩意可视化(这是什么鬼,怎么想到这个词语,暗自窃喜,(@__@) 嘻嘻)。
那到底弄什么呢?这个问题其实也没什么好想的,抓网页信息嘛!妈蛋?什么怎么抓,不会!从哪里入手,不知道!这就是我一开始的状态,后来得益于汪海的blog中python爬虫的启发,决定也用java玩一玩知乎,抓抓里面的2016年欧洲杯的热门话题、编辑推荐、今日最热。
专利--移动网络视觉雾霾检测系统
开始鼓捣我的博客啦,之前一直懒(原谅我是个懒癌患者)怕麻烦,就简单地在CSDN个人博客embedclub_LYF上写了点技术小文章,算是记录自己对写代码的一些吐槽吧。现在又动工一本正经的弄博客,完全是走向了一条深坑啊,小伙伴们慎入。
写博客是为了给未来的自己留下回忆,既然是回忆,当然不只是有上下求索的学术,也包括丰富多彩的生活片段,可能还有不成熟的胡思乱想,反正我就是想用文字记录下点滴与你分享。痛苦与你分享,便少了一分;快乐与你分享,则多了一倍。
记录点啥呢?第一篇就写写我和小伙伴李今晖同学一起申请的专利把,正好也拿到公布号了CN 105426837 A.
Hello World
你好,世界!每每遇上你就是入坑的开始…
我在github上搭建了属于自己的博客,写下自己的思考,和读书的笔记。希望能坚持下来。