⑴ vba如何抓取網頁上的數據
代碼:
Private Sub CommandButton1_Click()
Dim IE As Object
Dim i As Integer
i = 1
'打開網頁:創建一個IE對象,然後給一些屬性賦值。Visible是可見性,navigate是網頁地址
Set IE = CreateObject('internetexplorer.application')
With IE
.Visible = True
.navigate 'http://hanyu.iciba.com/pinyin.html'
'等待網頁完全載入
Do Until .ReadyState = 4
DoEvents
Loop
'拷貝漢字到網頁文本框,然後點擊轉換按鈕,並取出轉換結果
Do While Sheets('sheet1').Cells(i 1, 1).Value <> ''
'從IE.Document.all句柄中把頁面上要使用的節點找出來。這里的方法是:
.document.all('source').Value 給以source為ID的文本框賦值
.document.all.tags('img')(1).Click 點擊圖片集合里的第二張圖片
.document.all('to').Value 取出以to為ID的文本框內容
.document.all('source').Value = Sheets('sheet1').Cells(i 1, 1).Value
.document.all.tags('img')(1).Click
Do Until .ReadyState = 4
DoEvents
Loop
Sheets('sheet1').Cells(i 1, 2).Value = .document.all('to').Value
i = i 1
Loop
'關閉網頁
.quit
End With
End Sub
代碼解釋:(見注釋)
貼士:
1)VBA只能操作IE瀏覽器,原因就一句話:都是微軟家的產品嘛
2)要先引用Micorsoft Internet Controls
⑵ python怎樣抓取網頁中的文字和數字數據
通過xpath路徑來定位到要提取的元素,在路徑後面加上/text()可以提取該元素的文本,如果是要提取屬性值,在路徑後面加上/@屬性名就可以。如果要只採集數字或者文字,可以使用正則來實現。比如數字的正字表達式:[0-9]+。希望可以幫到題主
⑶ javascript 怎樣抓網頁上的內容
基本上都是靠定義在頁面上的id來抓取,舉例如下:
前提:頁面中某個text定義了id, 即 id="test",
目標:取得這個text中的內容,
方法:可以用如下方式:
document.getElementById("test").value;
也可以用:
document.getElementsByName("test")[0].value;
⑷ 如何用shell獲取html網頁中指定的文本數據
import sys
from lxml import etree
reload(sys)
sys.setdefaultencoding("utf8")
import requests
r = requests.get('http://best.pconline.com.cn/')
html = r.text
xmlhtml = etree.HTML(html)
content = xmlhtml.xpath('//div[starts-with(@id,"topic")]/div[1]/a[2]/text()')
urllist = xmlhtml.xpath('//div[starts-with(@id,"topic")]/div[1]/a[2]/@href')
lastime = xmlhtml.xpath('//div[starts-with(@id,"topic")]/div[2]/div[2]/span[2]/text()')
data_text = [ text for text in content ]
data_url = [ url for url in urllist ]
data_time = [ t.strip() for t in lastime ]
for i in xrange(0, len(data_text), 1):
print "%s, %s, %s" % (data_text[i], data_url[i], data_time[i])
⑸ 如何拿到html里Text的值
<input type="text" value="2" id="num">
用getElementById(num).value就可以得到
⑹ 如何抓取網頁上的文字信息到EXCEL表格里
1.通過搜索引擎,找到國家旅遊局的網站,點擊主菜單的【政務公開】——【統計數據】,則可以看到一系列包含數據的網頁。
⑺ 如何用爬蟲爬取網頁上的數據
用爬蟲框架Scrapy, 三步
定義item類
開發spider類
開發pipeline
如果你想要更透的信息,你可以參考《瘋狂python講義》