A. 微信的小程序如何屏蔽
在微信小程序是一種不需要下載安裝即可使用的應用,有很多人嫌棄小程序礙事太麻煩想關閉,其實關閉它也很簡單,先將我們打開我們的手機,然後我們點擊微信,在微信最右下角點擊我,然後找到設置一欄,打開找到發現頁管理一欄,打開,裡面就有小程序的開關鍵,我們將它關閉即可,以後想要再打開同樣操作即可,
B. 微信如何屏蔽小程序消息
首先打開微信,點擊右下角的【我】,選擇【設置】,找到【通用】選項,選擇【發現頁管理】;
這里我們可以看到,小程序這一功能處於啟用的狀態,接下來我們點擊【小程序】右邊的按鈕,使其處於關閉狀態即可;
現在我們返回到主頁,點擊下方的【發現】,可以看到小程序這一功能已經消失了,是不是很簡單呢,趕快試一下吧。
C. 如何徹底屏蔽微信小程序
點擊發現圖標
把微信主頁面打開之後,點擊頁面底部的【發現】圖標。
點擊小程序
跳轉到發現這個頁面之後,點擊頁面下方位置的【小程序】。
滑動小程序點擊刪除
將小程序頁面打開之後,選擇需要關閉的小程序並向左側滑動,點擊小程序後面的【刪除】按鈕。
D. 如何禁止別人爬蟲小程序代碼
Robots.txt-禁止爬蟲
robots.txt用於禁止網路爬蟲訪問網站指定目錄。robots.txt的格式採用面向行的語法:空行、注釋行(以#打頭)、規則行。規則行的格式為:Field:value。常見的規則行:User-Agent、Disallow、Allow行。
User-Agent行
User-Agent:robot-name
User-Agent:*
Disallow和Allow行
Disallow:/path
Disallow:#空字元串,起通配符效果,全禁止
Allow:/path
Allow:#空字元串,起通配符效果,全允許
搜索引擎的User-Agent對應名稱
搜索引擎
User-Agent值
Googlegooglebot
網路spider
雅虎slurp
MSNmsnbot
Alexais_archiver
我在Linux上抓包觀察到的一些搜索引擎訪問記錄:
#tcpmp-n-nn-A-l-s1024'tcpport80'|grepUser-Agent
User-Agent:Mozilla/5.0(compatible;Googlebot/2.1;+http://www.google.com/bot.html)
User-Agent:Googlebot-Image/1.0
User-Agent:Feedfetcher-Google;(+http://www.google.com/feedfetcher.html;5subscribers;feed-id=4619555564728728616)
User-Agent:Mozilla/5.0(compatible;Sosospider/2.0;+http://help.soso.com/webspider.htm)
User-Agent:Mozilla/5.0(compatible;YouBot/1.0;http://www.you.com/help/webmaster/spider/;)
User-Agent:Mozilla/5.0(compatible;JikeSpider;+http://shoulu.jike.com/spider.html)
JikeSpider是即刻搜索(人民搜索)。
robots.txt的補充
如果你沒有對網站根目錄的寫入許可權(無法建立robots.txt文件),或你想要某個指定的網頁不被搜索引擎收錄,可以使用元標簽阻止爬蟲訪問:
<metaname="robots"content="noindex"><!--阻止所有爬蟲-->
<metaname="googlerobot"content="noindex"><!--阻止Google收錄-->
robots元標記的默認值為"index,follow",它的取值可以是(來自Google站長幫助):
noindex防止網頁被編入索引。nofollow防止googlebot從此頁面中跟蹤鏈接。noarchive防止Google顯示網頁的快照鏈接。noimageindex不被Google圖片搜索索引。
現實中的robots.txt
淘寶屏蔽網路
淘寶屏蔽了網路抓取(2008年9月),http://www.taobao.com/robots.txt的內容:
User-agent:Baispider
Disallow:/
User-agent:spider
Disallow:/
網路與360的搜索引擎之爭
2012年8月,360推出搜索引擎,並與網路發生正面沖突。網路工程師跑出來說360違反robots協議,偷竊網路內容。以網路知道為例,http://..com/robots.txt的內容大致是這樣:
User-agent:Baispider
Disallow:/w?
Allow:/
User-agent:Googlebot
User-agent:MSNBot
User-agent:Baispider-image
User-agent:YouBot
User-agent:Sogouwebspider
User-agent:Sogouinstspider
User-agent:Sogouspider2
User-agent:Sogoublog
User-agent:SogouNewsSpider
User-agent:SogouOrionspider
User-agent:JikeSpider
User-agent:Sosospider
Allow:/
User-agent:*
Disallow:/
也就是說對360爬蟲而言,應該走最後一條規則,也就是禁止抓取網路知道所有內容。但從360搜索看,有網路知道的內容。