多线程中优先队列的使用示例 使用场景我们知道队列是遵循先进先出(First-In-First-Out)模式的,但有些时候需要在队列中基于优先级处理对象。 自己在处理爬数据时,代理ip的质量不一,在多线程抓数据时,利用优先队列,优先使用质量好的代理ip。 介绍 优先队列不允许空值,而且不支持non-comparable(不可比较)的对象,比如用户自定义的类。优先队列要求使用Java Comparable和Comparator接 2017-09-18 #PriorityQueue
Java 日志体系 由一张图说起图来源于https://www.slf4j.org/legacy.html 图中讲的如何通过SLF2J把各种日志框架桥接起来(可见java的日志框架之多)。主要有三部分: 都变为logback commons loging api –(jcl-voer-slf4j.jar)–> logback log4j –(log4j-over-slf4j.jar)–> logback 2017-09-08 #javalog
Java类加载时机与过程 文章部分内容引用于:从一道面试题来认识java类加载时机与过程 增加了一些自己的理解。 由一个题目引出写出下面代码的输出 1234567891011121314151617181920212223class SingleTon { private static SingleTon singleTon = new SingleTon(); public static int count1 2017-09-08 #java
Java中SPI机制介绍 SPI机制简介 SPI的全名为Service Provider Interface。大多数开发人员可能不熟悉,因为这个是针对厂商或者插件的。在java.util.ServiceLoader的文档里有比较详细的介绍。简单的总结下java spi机制的思想。我们系统里抽象的各个模块,往往有很多不同的实现方案,比如日志模块的方案,xml解析模块、jdbc模块的方案等。面向的对象的设计里,我们一般推荐模块 2017-09-08 #java
Java 内部的log的使用 介绍JDK自带的log的使用与运行方式 使用方法最简单的使用代码示例 123456public static void baseUse(){ Logger logger = Logger.getLogger(Main.class.getName()); logger.info("this is info"); logger.warning("this is 2017-09-07 #log
Ubuntu与CentOS的区别 观点参考 服务器操作系统应该选择 Debian/Ubuntu 还是 CentOS? 【小议】centos与ubuntu的区别 Linux扫盲篇:CentOS、Ubuntu CentOS、Ubuntu比较 个人体验上Ubuntu用起来比较舒服 安装软件方便 错误提示友好 支持软件兼容性好 内核更新快,很多新特性可以用上 使用apt-get安装软件 Centos有点难用,据说是稳定 2017-09-06
BitTorrent 原理介绍 原理简述BitTorrent(简称BT)协议其实是一个协议簇,BEP-3 是其基本协议内容,其他的大部分都是围绕这个来进行扩展或补充。要想从BT网络中下载一个资源,必须具备以下部分: 种子文件 BT客户端(专门解析BT协议的程序,比如迅雷,电驴) Tracker服务器 下载资源的时候,客户端首先解析种子文件,得到Tracker服务器的地址和资源信息,通过和Tracker服务器沟通得到其他已经下 2017-09-05 原理解析 #BitTorrent #DHT
ip代理池资料整理 使用Tornado+Redis维护ADSL拨号服务器代理池这里看到了“动态拨号VPS主机”实现自动波拨号 V2EX 怎么维护爬虫代理池讨论中有 ROS+多路 ADSL 是不错的多 IP 方案 `` 免费代理网站http://www.ip84.comhttp://www.mimiip.com 用 TOR ,可以通过 socket 给 TOR 发送切换新 ip 消息 总结抓免 2017-09-01
使用dnscrypt-proxy搭建无污染的dns服务 DNS劫持与DNS污染 ISP域名劫持中国大陆的互联网服务提供商经常劫持部分域名,转到自己指定的网站,以提供自己的广告,污染方式为劫持域名不存在时返回的NXDOMAIN记录(Non-existent domain)返回自己服务器的ip,从而跳转至自己的服务器上显示广告等内容。 由于通常的域名查询没有任何认证机制,而且域名查询通常基于无连接不可靠的UDP协议,查询者只能接受最先到达的格式正确结果, 2017-09-01
Nginx配置防盗链功能 什么是防盗链系统盗链是指在自己的页面上展示一些并不在自己服务器上的内容。通常的做法是通过技术手段获得它人服务器上的资源地址,绕过别人的资源展示页面,直接在自己的页面上向最终用户提供此内容。比较常见的是一些小站盗用大站的资源(图片、音乐、视频、软件等),对于这些小站来说,通过盗链的方法可以减轻自己服务器的负担,因为真实的空间和流量均是来自别人的服务器。 防盗链系统就是防范盗链的系统,防止别人通过一些 2017-08-27 #nginx