導航:首頁 > 數據處理 > 如何獲取大量數據文件

如何獲取大量數據文件

發布時間:2023-01-10 13:33:22

⑴ 我現在有大量格式固定的文件,我想快速讀取裡面相應的數據,然後放到資料庫裡面去。如何快速高效處理

一、常見用法:

F1 顯示當前程序或者windows的幫助內容。
F2 當你選中一個文件的話,這意味著「重命名」
F3 當你在桌面上的時候是打開「查找:所有文件」 對話框
F10或ALT 激活當前程序的菜單欄
windows鍵或CTRL+ESC 打開開始菜單
CTRL+ALT+DELETE 在win9x中打開關閉程序對話框
DELETE 刪除被選擇的選擇項目,如果是文件,將被放入回收站
SHIFT+DELETE 刪除被選擇的選擇項目,如果是文件,將被直接刪除而不是放入回收站
CTRL+N 新建一個新的文件
CTRL+O 打開「打開文件」對話框
CTRL+P 打開「列印」對話框
CTRL+S 保存當前操作的文件
CTRL+X 剪切被選擇的項目到剪貼板
CTRL+INSERT 或 CTRL+C 復制被選擇的項目到剪貼板
SHIFT+INSERT 或 CTRL+V 粘貼剪貼板中的內容到當前位置
ALT+BACKSPACE 或 CTRL+Z 撤銷上一步的操作
ALT+SHIFT+BACKSPACE 重做上一步的操作
Windows鍵+M 最小化所有被打開的窗口。
Windows鍵+CTRL+M 重新將恢復上一項操作前窗口的大小和位置
Windows鍵+E 打開資源管理器
Windows鍵+F 打開「查找:所有文件」對話框
Windows鍵+R 打開「運行」對話框
Windows鍵+BREAK 打開「系統屬性」對話框
Windows鍵+CTRL+F 打開「查找:計算機」對話框
SHIFT+F10或滑鼠右擊 打開當前活動項目的快捷菜單
SHIFT 在放入CD的時候按下不放,可以跳過自動播放CD。在打開word的時候按下不放,可以跳過自啟動的宏

ALT+F4 關閉當前應用程序
ALT+SPACEBAR 打開程序最左上角的菜單
ALT+TAB 切換當前程序
ALT+ESC 切換當前程序
ALT+ENTER 將windows下運行的MSDOS窗口在窗口和全屏幕狀態間切換
PRINT SCREEN 將當前屏幕以圖象方式拷貝到剪貼板
ALT+PRINT SCREEN 將當前活動程序窗口以圖象方式拷貝到剪貼板
CTRL+F4 關閉當前應用程序中的當前文本(如word中)
CTRL+F6 切換到當前應用程序中的下一個文本(加shift 可以跳到前一個窗口)

在IE中:

ALT+RIGHT ARROW 顯示前一頁(前進鍵)
ALT+LEFT ARROW 顯示後一頁(後退鍵)
CTRL+TAB 在頁面上的各框架中切換(加shift反向)
F5 刷新
CTRL+F5 強行刷新

目的快捷鍵

激活程序中的菜單欄 F10

執行菜單上相應的命令 ALT+菜單上帶下劃線的字母

關閉多文檔界面程序中的當

前窗口 CTRL+ F4

關閉當前窗口或退出程序 ALT+ F4

復制 CTRL+ C

剪切 CTRL+ X

刪除 DELETE

顯示所選對話框項目的幫助 F1

顯示當前窗口的系統菜單 ALT+空格鍵

顯示所選項目的快捷菜單 SHIFT+ F10

顯示「開始」菜單 CTRL+ ESC

顯示多文檔界面程序的系統

菜單 ALT+連字型大小(-)

粘貼 CTR L+ V

切換到上次使用的窗口或者

按住 ALT然後重復按TAB,

切換到另一個窗口 ALT+ TAB

撤消 CTRL+ Z

二、使用「Windows資源管理器」的快捷鍵

目的快捷鍵

如果當前選擇展開了,要折

疊或者選擇父文件夾左箭頭

折疊所選的文件夾 NUM LOCK+負號(-)

如果當前選擇折疊了,要展開

或者選擇第一個子文件夾右箭頭

展開當前選擇下的所有文件夾 NUM LOCK+*

展開所選的文件夾 NUM LOCK+加號(+)

在左右窗格間切換 F6

三、使用 WINDOWS鍵

可以使用 Microsoft自然鍵盤或含有 Windows徽標鍵的其他任何兼容鍵盤的以下快捷鍵。

目的快捷鍵

在任務欄上的按鈕間循環 WINDOWS+ TAB

顯示「查找:所有文件」 WINDOWS+ F

顯示「查找:計算機」 CTRL+ WINDOWS+ F

顯示「幫助」 WINDOWS+ F1

顯示「運行」命令 WINDOWS+ R

顯示「開始」菜單 WINDOWS

顯示「系統屬性」對話框 WINDOWS+ BREAK

顯示「Windows資源管理器」 WINDOWS+ E

最小化或還原所有窗口 WINDOWS+ D

撤消最小化所有窗口 SHIFT+ WINDOWS+ M

四、使用「我的電腦」和「Windows資源管理器」的快捷鍵

目的快捷鍵

關閉所選文件夾及其所有父文件夾按住 SHIFT鍵再單擊「關閉按鈕(僅適用於「我的電腦」)

向後移動到上一個視圖 ALT+左箭頭

向前移動到上一個視圖 ALT+右箭頭

查看上一級文件夾 BACKSPACE

五、使用對話框中的快捷鍵

目的快捷鍵

取消當前任務 ESC

如果當前控制項是個按鈕,要單擊該按鈕或者如果當前控制項是個復選框,要選擇或清除該復選框或者如果當前控制項是個選項按鈕,要單擊該選項空格單擊相應的命令 ALT+帶下劃線的字母

單擊所選按鈕 ENTER

在選項上向後移動 SHIFT+ TAB

在選項卡上向後移動 CTRL+ SHIFT+ TAB

在選項上向前移動 TAB

在選項卡上向前移動 CTRL+ TAB

如果在「另存為」或「打開」

對話框中選擇了某文件夾,

要打開上一級文件夾 BACKSPACE

在「另存為」或「打開」對

話框中打開「保存到」或

「查閱」 F4

刷新「另存為」或「打開」

對話框 F5

六、使用「桌面」、「我的電腦」和「Windows資源管理器」快捷鍵

選擇項目時,可以使用以下快捷鍵。

目的快捷鍵

插入光碟時不用「自動播放」

功能按住 SHIFT插入 CD-ROM

復制文件按住 CTRL拖動文件

創建快捷方式按住 CTRL+SHIFT拖動文件

立即刪除某項目而不將其放入 SHIFT+DELETE

「回收站」

顯示「查找:所有文件」 F3

顯示項目的快捷菜單 APPLICATION鍵

刷新窗口的內容 F5

重命名項目 F2

選擇所有項目 CTRL+ A

查看項目的屬性 ALT+ ENTER或 ALT+雙擊

可將 APPLICATION鍵用於 Microsoft自然鍵盤或含有 APPLICATION鍵的其他兼容鍵

七、Microsoft放大程序的快捷鍵

這里運用Windows徽標鍵和其他鍵的組合。

快捷鍵目的

Windows徽標+PRINT SCREEN將屏幕復制到剪貼板(包括滑鼠游標)

Windows徽標+SCROLL LOCK將屏幕復制到剪貼板(不包括滑鼠游標)

Windows徽標+ PAGE UP切換反色。

Windows徽標+ PAGE DOWN切換跟隨滑鼠游標

Windows徽標+向上箭頭增加放大率

Windows徽標+向下箭頭減小放大率

八、使用輔助選項快捷鍵

目的快捷鍵

切換篩選鍵開關右SHIFT八秒

切換高對比度開關左ALT+左SHIFT+PRINT SCREEN

切換滑鼠鍵開關左ALT+左SHIFT+NUM LOCK

切換粘滯鍵開關 SHIFT鍵五次

切換切換鍵開關 NUM LOCK五秒

⑵ 如何把大量數據導入EXCEL

1。用word打開txt文件
2。ctrl+h 將空格替換為段落標記(^p),注意連續空格的處理。
3。保存為txt文件
4。excel中,按你上面方法導入。

⑶ 如何獲取大數據

問題一:怎樣獲得大數據? 很多數據都是屬於企業的商業秘密來的,你要做大數據的一些分析,需要獲得海量的數據源,再此基礎上進行挖掘,互聯網有很多公開途徑可以獲得你想要的數據,通過工具可以快速獲得,比如說象八爪魚採集器這樣的大數據工具,都可以幫你提高工作效率並獲得海量的數據採集啊

問題二:怎麼獲取大數據 大數據從哪裡來?自然是需要平時對旅遊客群的數據資料累計最終才有的。
如果你們平時沒有收集這些數據 那自然是沒有的

問題三:怎麼利用大數據,獲取意向客戶線索 大數據時代下大量的、持續的、動態的碎片信息是非常復雜的,已經無法單純地通過人腦來快速地選取、分析、處理,並形成有效的客戶線索。必須依託雲計算的技術才能實現,因此,這樣大量又精密的工作,眾多企業紛紛藉助CRM這款客戶關系管理軟體來實現。
CRM幫助企業獲取客戶線索的方法:
使用CRM可以按照統一的格式來管理從各種推廣渠道獲取的潛在客戶信息,匯總後由專人進行篩選、分析、跟蹤,並找出潛在客戶的真正需求,以提供滿足其需求的產品或服務,從而使潛在客戶轉變為真正為企業帶來利潤的成交客戶,增加企業的收入。使用CRM可以和網站、電子郵件、簡訊等多種營銷方式相結合,能夠實現線上客戶自動抓取,迅速擴大客戶線索數量。

問題四:如何進行大數據分析及處理? 大數據的分析從所周知,大數據已經不簡簡單單是數據大的事實了,而最重要的現實是對大數據進行分析,只有通過分析才能獲取很多智能的,深入的,有價值的信息。那麼越來越多的應用涉及到大數據,而這些大數據的屬性,包括數量,速度,多樣性等等都是呈現了大數據不斷增長的復雜性,所以大數據的分析方法在大數據領域就顯得尤為重要,可以說是決定最終信息是否有價值的決定性因素。基於如此的認識,大數據分析普遍存在的方法理論有哪些呢?1. 可視化分析。大數據分析的使用者有大數據分析專家,同時還有普通用戶,但是他們二者對於大數據分析最基本的要求就是可視化分析,因為可視化分析能夠直觀的呈現大數據特點,同時能夠非常容易被讀者所接受,就如同看圖說話一樣簡單明了。2. 數據挖掘演算法。大數據分析的理論核心就是數據挖掘演算法,各種數據挖掘的演算法基於不同的數據類型和格式才能更加科學的呈現出數據本身具備的特點,也正是因為這些被全世界統計學家所公認的各種統計方法(可以稱之為真理)才能深入數據內部,挖掘出公認的價值。另外一個方面也是因為有這些數據挖掘的演算法才能更快速的處理大數據,如果一個演算法得花上好幾年才能得出結論,那大數據的價值也就無從說起了。3. 預測性分析。大數據分析最終要的應用領域之一就是預測性分析,從大數據中挖掘出特點,通過科學的建立模型,之後便可以通過模型帶入新的數據,從而預測未來的數據。4. 語義引擎。非結構化數據的多元化給數據分析帶來新的挑戰,我們需要一套工具系統的去分析,提煉數據。語義引擎需要設計到有足夠的人工智慧以足以從數據中主動地提取信息。5.數據質量和數據管理。大數據分析離不開數據質量和數據管理,高質量的數據和有效的數據管理,無論是在學術研究還是在商業應用領域,都能夠保證分析結果的真實和有價值。大數據分析的基礎就是以上五個方面,當然更加深入大數據分析的話,還有很多很多更加有特點的、更加深入的、更加專業的大數據分析方法。大數據的技術數據採集:ETL工具負責將分布的、異構數據源中的數據如關系數據、平面數據文件等抽取到臨時中間層後進行清洗、轉換、集成,最後載入到數據倉庫或數據集市中,成為聯機分析處理、數據挖掘的基礎。數據存取:關系資料庫、NOSQL、SQL等。基礎架構:雲存儲、分布式文件存儲等。數據處理:自然語言處理(NLP,Natural Language Processing)是研究人與計算機交互的語言問題的一門學科。處理自然語言的關鍵是要讓計算機」理解」自然語言,所以自然語言處理又叫做自然語言理解(NLU,Natural Language Understanding),也稱為計算語言學(putational Linguistics。一方面它是語言信息處理的一個分支,另一方面它是人工智慧(AI, Artificial Intelligence)的核心課題之一。統計分析:假設檢驗、顯著性檢驗、差異分析、相關分析、T檢驗、方差分析、卡方分析、偏相關分析、距離分析、回歸分析、簡單回歸分析、多元回歸分析、逐步回歸、回歸預測與殘差分析、嶺回歸、logistic回歸分析、曲線估計、因子分析、聚類分析、主成分分析、因子分析、快速聚類法與聚類法、判別分析、對應分析、多元對應分析(最優尺度分析)、bootstrap技術等等。數據挖掘:分類(Classification)、估計(Estimation)、預測(Predic膽ion)、相關性分組或關聯規則(Affinity grouping or association rules)、聚類(Clustering)、描述和可視化......>>

問題五:網路股票大數據怎麼獲取? 用「網路股市通」軟體。
其最大特色是主打大數據信息服務,讓原本屬於大戶的「大數據炒股」變成普通網民的隨身APP。

問題六:通過什麼渠道可以獲取大數據 看你是想要哪方面的,現在除了互聯網的大數據之外,其他的都必須要日積月累的

問題七:通過什麼渠道可以獲取大數據 有個同學說得挺對,問題傾向於要的是數據,而不是大數據。
大數據講究是全面性(而非精準性、數據量大),全面是需要通過連接來達成的。如果通過某個app獲得使用該app的用戶的終端信息,如使用安卓的佔比80%,使用iPhone的佔比為20%, 如果該app是生活訂餐的應用,你還可以拿到使用安卓的這80%的用戶平時網上訂餐傾向於的價位、地段、口味等等,當然你還會獲取這些設備都是在什麼地方上網,設備的具體機型你也知道。但是這些數據不斷多麼多,都不夠全面。如果將這部分用戶的手機號或設備號與電子商務類網站數據進行連接,你會獲取他們在電商網站上的消費數據,傾向於購買的品牌、價位、類目等等。每個系統可能都只存儲了一部分信息,但是通過一個連接標示,就會慢慢勾勒出一個或一群某種特徵的用戶的較全面的畫像。

問題八:如何從大數據中獲取有價值的信息 同時,大數據對公共部門效益的提升也具有巨大的潛能。如果美國醫療機構能夠有效地利用大數據驅動醫療效率和質量的提高,它們每年將能夠創造超過3萬億美元的價值。其中三分之二是醫療支出的減少,占支出總額超過8%的份額。在歐洲發達國家, *** 管理部門利用大數據改進效率,能夠節約超過14900億美元,這還不包括利用大數據來減少欺詐,增加稅收收入等方面的收益。
那麼,CIO應該採取什麼步驟、轉變IT基礎設施來充分利用大數據並最大化獲得大數據的價值呢?我相信用管理創新的方式來處理大數據是一個很好的方法。創新管道(Innovation pipelines)為了最終財務價值的實現從概念到執行自始至終進行全方位思考。對待大數據也可以從相似的角度來考慮:將數據看做是一個信息管道(information pipeline),從數據採集、數據訪問、數據可用性到數據分析(4A模型)。CIO需要在這四個層面上更改他們的信息基礎設施,並運用生命周期的方式將大數據和智能計算技術結合起來。
大數據4A模型
4A模型中的4A具體如下:
數據訪問(Access):涵蓋了實時地及通過各種資料庫管理系統來安全地訪問數據,包括結構化數據和非結構化數據。就數據訪問來說,在你實施越來越多的大數據項目之前,優化你的存儲策略是非常重要的。通過評估你當前的數據存儲技術並改進、加強你的數據存儲能力,你可以最大限度地利用現有的存儲投資。EMC曾指出,當前每兩年數據量會增長一倍以上。數據管理成本是一個需要著重考慮的問題。
數據可用性(Availability):涵蓋了基於雲或者傳統機制的數據存儲、歸檔、備份、災難恢復等。
數據分析(Analysis):涵蓋了通過智能計算、IT裝置以及模式識別、事件關聯分析、實時及預測分析等分析技術進行數據分析。CIO可以從他們IT部門自身以及在更廣泛的范圍內尋求大數據的價值。
用信息管道(information pipeline)的方式來思考企業的數據,從原始數據中產出高價值回報,CIO可以使企業獲得競爭優勢、財務回報。通過對數據的完整生命周期進行策略性思考並對4A模型中的每一層面都做出詳細的部署計劃,企業必定會從大數據中獲得巨大收益。 望採納

問題九:如何獲取互聯網網大數據 一般用網路蜘蛛抓取。這個需要掌握一門網路編程語言,例如python

問題十:如何從網路中獲取大量數據 可以使用網路抓包,抓取網路中的信息,推薦工具fiddler

⑷ Excel怎樣批量提取文件夾和子文件夾所有文件

題意理解:希望批量提取所有文件(註:特定某類文件),並批量建立超鏈接,當發給對方時,對方可以直接打開文件(註:雙方對於文件路徑均有共享權)

解法(該解法針對批量提取某類特定文件或所有文件,並批量建立超鏈接):
一. 批量提取文件
方法一. 微軟WIN 8或者WIN 10 操作系統,可以藉助自帶功能實現批量獲取文件夾內文件路徑:選擇全部文件或某類文件,同時按住shift和滑鼠右鍵,會出現「復制為路徑」的選項。

批量超鏈接公式

三. 針對題述要求的解法
1. 從圖片上看,題述文件所在電腦操作系統應該是 win7,所以可以用上述「批量提取文件」的「方法一」,即:
2. 在「A0101板材類」文件夾下,選取所有 .xlsx 文件,同時按住shift和滑鼠右鍵,當出現「復制為路徑」的選項時,滑鼠左鍵點擊該選項。
3. 在 Excel 文件內粘貼後,在其右邊相鄰的單元格內,鍵入公式「=Hyperlink(Link-location,[Friendly-name])」並下拉

⑸ 如何使用python將大量數據導出到Excel中的小技巧

如何使用python將大量數據導出到Excel中的小技巧

(1) 問題描述:為了更好地展示數據,Excel格式的數據文件往往比文本文件更具有優勢,但是具體到python中,該如何導出數據到Excel呢?如果碰到需要導出大量數據又該如何操作呢?本文主要解決以上兩個問題。

(2)具體步驟如下:
1.第一步,安裝openpyxl,
使用pip install openpyxl即可,但是在windows下安裝的是2.2.6版本,但是centos自動安裝的是4.1版本,(多謝海哥的提醒)。
寫的代碼在windows下運行沒問題,但centos上卻報錯了,說是ew=ExcelWriter(workbook=wb)少提供一個參數,於是果斷在 237伺服器上我已安裝2.2.6版本的,問題解決。
pip install openpyxl==2.2.6
2.第二步,哈哈,沒有啦,廢話不說了,直接上代碼,ps,代碼中包含xlwt和openpyxl的兩個實現版本。

(3)擴展閱讀:通過查閱資料,發現網上眾說紛紜,總結起來有如下幾點:
python Excel相關的操作的mole lib有兩組,一組是xlrd、xlwt、xlutils,另一組是openpyxl,
但是前一組(xlrd,xlwt)比較老,只能處理由Excel 97-2003 或者Excel 97 以前版本生成的xls格式的excel文件,xlwt甚至不支持07版以後的excel ,這個格式excel文件一般來說,最大隻能支持256列或者65536行的excel文件。
因此面對需要導出大量數據到excel的情況,你將有如下三種選擇,(1)換一種存儲格式,如保存為CSV文件 (2)使用openpyxl—,因為它支持對Excel 2007+ xlsx/xlsm format的處理 (3) win32 COM (Windows only)
當然,我們要直面困難了,為了更好地展示數據給產品和用戶,我們依然選擇的第二種。
ps,非常lucky,一番搜索後我找到了openpyxl,支持07+的excel,一直有人在維護,文檔清晰易讀,參照Tutorial和API文檔很快就能上手,就是它了~
(4)閑話少說,直接上代碼,敬請參考

# coding:utf-8
'''
# 希望對大家有幫助哈,請多提問題
create by yaoyz
date: 2017/01/24
'''
import xlrd
import xlwt
# workbook相關
from openpyxl.workbook import Workbook
# ExcelWriter,封裝了很強大的excel寫的功能
from openpyxl.writer.excel import ExcelWriter
# 一個eggache的數字轉為列字母的方法
from openpyxl.utils import get_column_letter
from openpyxl.reader.excel import load_workbook

class HandleExcel():
'''Excel相關操作類'''
def __init__(self):
self. head_row_labels = [u'學生ID',u'學生姓名',u'聯系方式',u'知識點ID',u'知識點名稱']
"""
function:
讀出txt文件中的每一條記錄,把它保存在list中
Param:
filename: 要讀出的文件名
Return:
res_list: 返回的記錄的list
"""
def read_from_file(self,filename):
res_list=[]
file_obj=open(filename,"r")
for line in file_obj.readlines():
res_list.append(line)
file_obj.close()
return res_list
"""
function:
讀出*.xlsx中的每一條記錄,把它保存在data_dic中返回
Param:
excel_name: 要讀出的文件名
Return:
data_dic: 返回的記錄的dict
"""
def read_excel_with_openpyxl(self, excel_name="testexcel2007.xlsx"):
# 讀取excel2007文件
wb = load_workbook(filename=excel_name)
# 顯示有多少張表
print "Worksheet range(s):" , wb.get_named_ranges()
print "Worksheet name(s):" , wb.get_sheet_names()
# 取第一張表
sheetnames = wb.get_sheet_names()
ws = wb.get_sheet_by_name(sheetnames[0])
# 顯示表名,錶行數,表列數
print "Work Sheet Titile:" ,ws.title
print "Work Sheet Rows:" ,ws.get_highest_row()
print "Work Sheet Cols:" ,ws.get_highest_column()
# 獲取讀入的excel表格的有多少行,有多少列
row_num=ws.get_highest_row()
col_num=ws.get_highest_column()
print "row_num: ",row_num," col_num: ",col_num
# 建立存儲數據的字典
data_dic = {}
sign=1
# 把數據存到字典中
for row in ws.rows:
temp_list=[]
# print "row",row
for cell in row:
print cell.value,
temp_list.append(cell.value)
print ""
data_dic[sign]=temp_list
sign+=1
print data_dic
return data_dic
"""
function:
讀出*.xlsx中的每一條記錄,把它保存在data_dic中返回
Param:
records: 要保存的,一個包含每一條記錄的list
save_excel_name: 保存為的文件名
head_row_stu_arrive_star:
Return:
data_dic: 返回的記錄的dict
"""
def write_to_excel_with_openpyxl(self,records,head_row,save_excel_name="save.xlsx"):
# 新建一個workbook
wb = Workbook()
# 新建一個excelWriter
ew = ExcelWriter(workbook=wb)
# 設置文件輸出路徑與名稱
dest_filename = save_excel_name.decode('utf-8')
# 第一個sheet是ws
ws = wb.worksheets[0]
# 設置ws的名稱
ws.title = "range names"
# 寫第一行,標題行
for h_x in range(1,len(head_row)+1):
h_col=get_column_letter(h_x)
#print h_col
ws.cell('%s%s' % (h_col, 1)).value = '%s' % (head_row[h_x-1])
# 寫第二行及其以後的那些行
i = 2
for record in records:
record_list=str(record).strip().split("\t")
for x in range(1,len(record_list)+1):
col = get_column_letter(x)
ws.cell('%s%s' % (col, i)).value = '%s' % (record_list[x-1].decode('utf-8'))
i += 1
# 寫文件
ew.save(filename=dest_filename)
"""
function:
測試輸出Excel內容
讀出Excel文件
Param:
excel_name: 要讀出的Excel文件名
Return:

"""
def read_excel(self,excel_name):
workbook=xlrd.open_workbook(excel_name)
print workbook.sheet_names()
# 獲取所有sheet
print workbook.sheet_names() # [u'sheet1', u'sheet2']
sheet2_name = workbook.sheet_names()[1]
# 根據sheet索引或者名稱獲取sheet內容
sheet2 = workbook.sheet_by_index(1) # sheet索引從0開始
sheet2 = workbook.sheet_by_name('Sheet1')
# sheet的名稱,行數,列數
print sheet2.name,sheet2.nrows,sheet2.ncols
# 獲取整行和整列的值(數組)
rows = sheet2.row_values(3) # 獲取第四行內容
cols = sheet2.col_values(2) # 獲取第三列內容
print rows
print cols
# 獲取單元格內容
print sheet2.cell(1,0).value
print sheet2.cell_value(1,0)
print sheet2.row(1)[0].value
# 獲取單元格內容的數據類型
print sheet2.cell(1,0).ctype
# 通過名稱獲取
return workbook.sheet_by_name(u'Sheet1')
"""
function:
設置單元格樣式
Param:
name: 字體名字
height: 字體高度
bold: 是否大寫
Return:
style: 返回設置好的格式對象
"""
def set_style(self,name,height,bold=False):
style = xlwt.XFStyle() # 初始化樣式
font = xlwt.Font() # 為樣式創建字體
font.name = name # 'Times New Roman'
font.bold = bold
font.color_index = 4
font.height = height
borders= xlwt.Borders()
borders.left= 6
borders.right= 6
borders.top= 6
borders.bottom= 6
style.font = font
style.borders = borders
return style
"""
function:
按照 設置單元格樣式 把計算結果由txt轉變為Excel存儲
Param:
dataset:要保存的結果數據,list存儲
Return:
將結果保存為 excel對象中
"""
def write_to_excel(self, dataset,save_excel_name,head_row):
f = xlwt.Workbook() # 創建工作簿
# 創建第一個sheet:
# sheet1
count=1
sheet1 = f.add_sheet(u'sheet1', cell_overwrite_ok=True) # 創建sheet
# 首行標題:
for p in range(len(head_row)):
sheet1.write(0,p,head_row[p],self.set_style('Times New Roman',250,True))
default=self.set_style('Times New Roman',200,False) # define style out the loop will work
for line in dataset:
row_list=str(line).strip("\n").split("\t")
for pp in range(len(str(line).strip("\n").split("\t"))):
sheet1.write(count,pp,row_list[pp].decode('utf-8'),default)
count+=1
f.save(save_excel_name) # 保存文件

def run_main_save_to_excel_with_openpyxl(self):
print "測試讀寫2007及以後的excel文件xlsx,以方便寫入文件更多數據"
print "1. 把txt文件讀入到內存中,以list對象存儲"
dataset_list=self.read_from_file("test_excel.txt")
'''test use openpyxl to handle EXCEL 2007'''
print "2. 把文件寫入到Excel表格中"
head_row_label=self.head_row_labels
save_name="test_openpyxl.xlsx"
self.write_to_excel_with_openpyxl(dataset_list,head_row_label,save_name)
print "3. 執行完畢,由txt格式文件保存為Excel文件的任務"
def run_main_save_to_excel_with_xlwt(self):
print " 4. 把txt文件讀入到內存中,以list對象存儲"
dataset_list=self.read_from_file("test_excel.txt")
'''test use xlwt to handle EXCEL 97-2003'''
print " 5. 把文件寫入到Excel表格中"
head_row_label=self.head_row_labels
save_name="test_xlwt.xls"
self.write_to_excel_with_openpyxl(dataset_list,head_row_label,save_name)
print "6. 執行完畢,由txt格式文件保存為Excel文件的任務"
if __name__ == '__main__':
print "create handle Excel Object"
obj_handle_excel=HandleExcel()
# 分別使用openpyxl和xlwt將數據寫入文件
obj_handle_excel.run_main_save_to_excel_with_openpyxl()
obj_handle_excel.run_main_save_to_excel_with_xlwt()
'''測試讀出文件,注意openpyxl不可以讀取xls的文件,xlrd不可以讀取xlsx格式的文件'''
#obj_handle_excel.read_excel_with_openpyxl("testexcel2003.xls") # 錯誤寫法
#obj_handle_excel.read_excel_with_openpyxl("testexcel2003.xls") # 錯誤寫法
obj_handle_excel.read_excel("testexcel2003.xls")
obj_handle_excel.read_excel_with_openpyxl("testexcel2007.xlsx")

⑹ 我本地計算機有個.db文件,裡面存儲了大量的數據,我想將其中的部分數據導出為excel文件,請問如何導出

如果直接用Excel打開「.DB」資料庫時,在Excel2000下出現「不能識別的文件格式」錯誤,在Excel2003下將出現「外部表不是預期的格式」的錯誤,現在我們來安裝一個BDE(Borland Database Engine),安裝BDE後,就可以用Excel2003直接打開Paradoxd 的「.DB」 文件了。如果用Excel2000,則只能用「數據」菜單中的「獲取外部數據」的功能來處理打開.db文件。下面,一步一步來完成此工作。
1、「數據」→「獲取外部數據」→「新建資料庫查詢」。見下圖:

2、打開「選擇數據源」對話框後,選擇「新數據源」,並按「確定」按鈕,見下圖:

3、輸入數據源名稱(自己為數據源起個名稱),選擇「Micrsoft Paradox Driver (*.db)」作為驅動程序,見下圖:

4、點擊「連接」按鈕,打開「ODBC Paradox 安裝」對話框,如下圖:

5、取消「使用當前目錄」選項,點擊「選擇目錄」按鈕,出現「選擇目錄」對話框,選擇正確的驅動器、文件夾,找到.db資料庫所在的目錄後,按「確定」按鈕,入下圖:

6、這時,在「創建數據源」的對話框中,將出現資料庫所在的目錄就資料庫文件的信息,入下圖:

7、按「確定」按鈕,完成「新建數據源」工作,回到「選擇數據源」對話框,入下圖:

8、再按「確定」按鈕,按照屏幕提示即可打開需要的「.DB」文件。
9、用Excel的「獲取外部數據」功能,還可以選擇交叉表中的數據,只需要使用相應的SQL語句即可。

閱讀全文

與如何獲取大量數據文件相關的資料

熱點內容
通達信數據統計如何設置 瀏覽:644
唐山原裝紅酒代理怎麼談 瀏覽:834
兩張表格長度不一樣怎麼整合信息 瀏覽:831
數據分析師如何更好理解業務 瀏覽:867
窩輪交易是什麼時候開始的 瀏覽:191
產品品質如何快速提升 瀏覽:940
石碣有哪些人才市場 瀏覽:666
如何把小程序的文件列印出來 瀏覽:588
數據公司就業前景如何 瀏覽:96
電腦出現藍屏程序怎麼改 瀏覽:167
一加的產品為什麼這么多 瀏覽:991
關聯程序有什麼用 瀏覽:19
為什麼建材專業市場拆遷 瀏覽:458
碳交易權哪裡開戶 瀏覽:604
專業技術軍官怎麼改革 瀏覽:968
代理公司執照需要什麼手續 瀏覽:986
艾特九九產品怎麼樣 瀏覽:230
酒店專屬產品怎麼做 瀏覽:615
基恩士怎麼建立新程序 瀏覽:10
奧比島怎麼修改程序 瀏覽:51