欢迎访问职称论文网!
科技论文

小型网站的网络安全策略

1关于网络爬虫的概念和“爬取”过程

网络爬虫(WebSpider)又称“网络蜘蛛”,它可以模拟正常用户的一些行为,并根据一定的规则自动捕获网络中的各种信息。搜索引擎也是一种网络爬虫,但它不影响网站的正常运行,也没有任何恶意行为。一些恶意的网络爬虫通常在短时间内消耗大量的网络资源,导致网站的正常运行,导致服务器崩溃。大多数爬虫程序通过预设队列来存储URL,在进行网页爬取时,首先从某一个或几个个URL开始,记录URL,然后从网页上找到其他链接URL放入队列,不断从当前页面找到新的URL,这种循环,直到满足设定的停止条件。

2网络爬虫爬取网站的案例及简单分析

2.预测网站安全技术措施1

现在许多网站在一定程度上做了一些安全保护,但由于成本和技术原因,大多数小型网站的网络安全策略相对较弱,用爬虫案例来测试网站的网络安全问题。首先,在一个诗歌网站上找到内容并检查它PC网站请求地址,https://xxx.cn/mingju/xx.aspx?p=2&t=&c=只是找到不同的页面p=xx不同,xx=当前页面值,当p<=30时,页面显示正常,但当翻页超过30页时,系统返回错误页面,提示,“由于服务器费用对本站造成巨大压力,请下载客户端进行访问”。说明系统对大量数据做了一些安全策略限制。当请求超过30页时,提示使用手机APP来访问。所以试从APP寻找破解方法,通过抓包工具PacketCapture成功地找到了数据请求接口。

2.2.编写爬虫源代码

2.爬虫源代码运行结果及安全分析

运行程序,包括朝代、作者、诗歌名称、内容等,都成功抓取,将结果保存成Excel文件。文件内容示例:桃李春风一杯酒,江湖夜雨十年灯。->黄庭坚《送黄几复》一生可以笑几次,见面一定要喝醉。本案中,网站只拦截客户端,翻页30页以上提示错误页面,但服务端接口没有流量访问控制,身份(如)Ip,浏览器特性)验证,所以通过抓取包获取请求接口后,可以随意请求获取所需数据。对于隐私较弱的网站,可能没有特别重要的信息泄露,但对于涉及个人隐私等安全信息的网站,如果可以随意抓取数据,会有很大的安全隐患。我以不同的方式测试了其他几个网站,发现虽然大部分网站都做了一些网络安全保护,但都比较简单,信息安全保护远远不够。

3基于爬虫的网络安全风险和防范

3.1网络安全风险

网络安全不到位会有很多风险,比如一个网站上有一个10MB使用爬虫抓取文件1000次,会使网站产生大量的出站流量,可能使服务器瘫痪,无法正常访问。几种恶意爬虫入侵方式:(1)通过测试网站或后门调试程序入侵。目前,大多数基于网络服务的系统都配备了测试页面和调试后门程序。有些人可以通过这些页面或程序直接访问服务器端的敏感数据,而无需正常认证。一旦这些敏感数据被感兴趣的人使用,它们可能会成为网络分析和攻击的来源,并出现各种安全问题。(2)通过管理界面入侵。为了方便管理,许多网络平台和系统都提供了基于网页的管理界面,允许管理员进行远程管理和控制。恶意爬虫程序通过搜索管理员登录页面获取URL,经过一系列的网络爬行或攻击,网络安全得不到保护。(3)通过网页直接搜索入侵。恶意网络爬虫程序直接通过互联网搜索用户的个人信息,如用户姓名、电话号码、微信号码、身份证号码等个人隐私,恶意用户可能进行攻击或欺诈。恶意的网络爬虫很容易攻击网络,所以我们必须采取一定的措施来限制网络爬虫的访问权限,一方面打开需要搜索引擎包含的页面,同时保护一些敏感的页面。

3.2限制网络爬虫的基本技能

3.2.1对于程序本身的反爬策略,大多数爬虫程序都是爬网站页面的源文件,比如爬静态页面html代码,很难爬到动态。了解爬虫的原理,可以通过仿写来模仿爬虫的原理,html,让网站程序本身穿上“防爬外衣”伪装。例如,可以使用其他技术模仿写作html,爬虫很难获取信息。这样的技术还有很多,就不一一举例了。

3.2.2.数据包字段的反爬策略HTTP请求中的UserAgent字段可识别浏览器、引擎、操作系统、设备信息等。UserAgent字段有自己的特点,比如百度搜索引擎爬虫会有类似的特点Baiduspider的字符串,Mozilla/5.0(compati-ble;Baiduspider/2.0;+www.baidu.com/search/spider.html))。通过对UserAgent对特定字符的限制可以防止这些爬虫过度抓取网站。

3.2.3对于用户行为的反爬行策略爬虫毕竟是机器人,不管它们有多像人类行为。普通用户很少在短时间内多次访问同一页面或同一账户,这种行为基本上可以判断为爬虫。爬虫通常可以通过网站分析软件过滤IP和访问频率等,针对这种情况,可以采取适当的措施限制网络爬虫的访问权限,例如可以采取限制IP或者通过访问频率来防止这种爬虫,从而保护用户行为的隐私,保持网站的安全运行。

4结语

随着全球信息化步伐的加快,安全问题迫在眉睫,不仅涉及个人利益、企业生存、金融风险等问题,而且直接涉及社会稳定等方面,了解网络面临的各种威胁,防范和消除这些威胁,已成为网络发展中最重要的事情之一。


热门期刊