導航:首頁 > 數據處理 > 怎麼可以讓數據簡化

怎麼可以讓數據簡化

發布時間：2022-11-06 10:09:02

① excel如何讓所有數據四捨五入保留小數點後三位

使用單元格格式中的數值，小數改為3為0.000的話，只是顯示上是保留了3位小數，並非真正3位小數的數值，也就是說，遇到進位的問題就不準了，最好使用ROUND函數。

寫法：=round(A1,3)；A1可以換成任意單元格，3表示保留3位小數，遇到進位自動四捨五入。

例1：=round(1.123,2)結果為1.12；

例2：假設A1=1.123, B1輸入公式=round(A1,2) 結果為1.12

例3：=round(1/3,2) 結果為0.33...第一參數為所要計算的值(可以是常數,單元格引用,公式)，第二個參數為舍入的小數位數。

(1)怎麼可以讓數據簡化擴展閱讀：

默認情況下，Excel 使用 A1 引用樣式，此樣式引用字母標識列（從 A 到 IV，共 256 列，備註：版本不同最大列數也不同），引用數字標識行（從 1 到 65,536）。這些字母和數字稱為行號和列標。若要引用某個單元格，請輸入列標和行號。例如，B2 引用列 B 和行 2 交叉處的單元格。

也可以使用同時統計工作表上行和列的引用樣式。R1C1 引用樣式對於計算位於宏內的行和列很有用。在 R1C1 樣式中，Excel 指出了行號在 R 後而列號在 C 後的單元格的位置。例如，R2C3 相當於A1引用樣式的C2，即引用行 2 和列 3(即C) 交叉處的單元格。

② 將大數據轉化為大價值的10種途徑

將大數據轉化為大價值的10種途徑
大數據可以產生很多價值，但前提是只有當您企業真正知道如何充分利用這些大數據的時候。
當前，大數據顯然已經登上了歷史舞台——在全球范圍內，擁有超過半數的企業組織都已經將大數據項目視為其未來發展的機遇，並計劃在未來幾年內進一步的增加對大數據項目的投資。
但是，大數據的價值並不僅僅只是來自對於相關數據信息的收集而已，這僅僅只是起點。大數據的真正價值來自於您所在的企業組織利用所存儲的信息以發現新的洞察分析見解的能力，然後從中提取出有用的價值，以推動企業做出更好的業務決策，促進企業業務的發展。
現如今，現代化的商務智能解決方案可以通過用戶友好的解決方案來降低企業進入的大數據項目的壁壘，並進一步的提升大數據的價值。這允許企業組織內的更多的相關人員(不僅僅只有數據科學家)能夠就您企業所收集的數據進行訪問、分析和協作。
您企業的團隊如何獲取大數據的驅動價值?
大數據能夠為您的公司提供更為詳細的洞察分析，來洞察企業的各個方面的關鍵要素，以推動更好、更自信、且數據驅動的商業決策。
其培養一種積極開拓探索的企業文化，鼓勵企業員工們通過數據分析來試驗和驗證他們的想法。
通過讓每名相關的工作人員都能訪問到這些大數據信息，推動您企業業務的下一此大的創意性變革的理念可以來自企業的任何一名員工——而不僅僅只是數據科學家。
究竟什麼是大數據?
大數據是數據量相當龐大或結構相當復雜，以至於一般性的企業組織機構難以使用標準的資料庫和軟體工具對其進行管理。但由於每家公司都有不同的能力和要求，故而「大數據」其實可以說是一個相對較為主觀性的術語——對某一家企業組織來說的「大」數據，對另一家企業組織而言可能僅僅只是「平均」性的數據。
想要從您企業的大數據投資項目中獲得更多價值嗎?
如下，我們將為您介紹10種有助於您所在的企業更好的從大數據分析項目中獲取價值的方法：
選擇正確的訪問大數據的方法。
獲得更好的洞察分析的能力與企業所收集到的數據信息有關。
讓整個企業組織都能夠訪問到大數據。
讓相關用戶能夠很容易的找到他們所需要的數據信息。
推動企業內各部門間的協同合作，以推動創新。
打造一個靈活敏捷的分析環境，以便滿足每位用戶的需求。
確保企業所採用的分析解決方案能夠方便的讓相關員工在任何地方採用任何設備均能夠輕松訪問。
部署可擴展的解決方案，確保其能夠隨著企業組織的業務需求的不斷變化而變化。
確保您企業的商務智能解決方案可以很容易地適應未來的技術。
選擇具有廣泛合作夥伴生態系統的BI解決方案。
一、選擇正確的訪問大數據的方法
當涉及到如何訪問和分析所有的數據信息時，沒有一套一成不變的方法——畢竟，每家不同的企業組織都會有著不同的需求、不同的用例和不同的基礎設施配置。
您企業所選擇的方法或方法的組合將取決於所需要滿足的特定用戶的實際需求，並權衡您所願意接受的各種折衷。
當企業組織在選擇大數據的訪問方法時，所需要考慮的相關問題：
您企業需要支持多少數據?數以百萬計的?抑或是數十億的?
相關非技術用戶是否需要訪問您企業的數據，或者僅僅只有IT和數據專家們訪問這些數據呢?您企業將只在整個數據集上運行數據分析嗎?或者您企業還希望能夠分析可選擇的相關數據呢?
您企業是否需要為終端用戶提供流暢、高交互性的體驗?靈活性或用戶性能對您企業的業務來說是最為重要的嗎?
二、企業獲取洞察分析的能力更多的關乎到企業對相關數據是如何收集的
以前，您企業的大數據項目所面臨的最大的挑戰可能是從廣泛的數據源中識別和收集您企業業務真正所需要的數據信息。
而到了今天，這部分比以往更容易。現在，真正重要的是您企業是否可以收集並整合所有這些數據信息——無論這些大數據具體是來自何處也不管其格式究竟如何，並最終發現所有相關數據信息中的所有可能的聯系。
為了獲得對於大數據的更為全面的掌握，企業組織亟待採用具有關聯模型的BI解決方案，以便您企業可以瀏覽所有數據中的所有關聯。這樣，您企業的用戶將始終可以訪問您企業業務的完整視圖，以便他們可以做出更好、更明智的決策。
與傳統的數據模型不同(傳統的數據模型會限制您所能夠看到的數據，這些數據如何連接以及您所能夠執行的查詢)，關聯模型則可以識別您企業的所有數據之間的所有關系。這使得每位用戶 ——不僅僅是數據科學家——均可以快速輕松地探索他們所需要的合適的數據，並使用互動式的選擇和關鍵字搜索來發現意想不到的關鍵和洞察見解。
三、讓整個企業組織均可以訪問大數據
當大數據這一理念剛剛興起的時候，僅僅只有極少數的人意識到其所蘊含的巨大潛力——這些人主要是數據科學家和分析師。非專業人士根本不具備以有意義的方式探索和使用數據所需的知識、工具或經驗。
而今，這種狀況已經一去不復返了。現在，您企業必須將大數據置於業務部門的用戶手中。畢竟，只有那些與您企業的業務最接近的員工們才真正的知道要提出哪些有價值的問題;以及由數據所驅動的哪些分析見解將對企業的業務產生最大的影響。
正確的自助式商務智能解決方案可以在這方面為企業客戶提供有力的幫助，其能夠讓業務部門的用戶順利訪問到他們所需的數據，同時讓數據治理和管理的許可權掌握在您企業的IT團隊手中。藉助自助式服務商務智能解決方案，業務部門的用戶可以使用互動式的可視化儀錶板來自由的探索數據，並在不依賴IT部門的情況下找到問題的答案，改進業務流程，並推動整個企業組織內的創新。
推動企業朝著自助式分析方向轉變的因素：
在最近的一份報告中，Forbes Insights調查了449位資深的IT和商業專業人士，了解了他們為什麼決定轉向採用自助服務模式：
62%的受訪者希望對於數據獲得更多的開放式訪問。
76%的受訪者希望獲得更為及時的數據分析。
71%的受訪者希望獲得質量更高的數據和分析。
四、讓用戶可以輕松找到其所需的大數據信息
越來越多的企業業務管理者希望通過確鑿的證據來支持他們的業務決策過程。但不幸的是，這些用戶往往缺乏經驗，因為他們需要在一個龐大的，不斷增長的數據存儲庫中找到他們所需要的答案。
為了幫助業務部門的用戶們找到這些答案，並從大數據中獲得更多的投資回報，您企業需要讓他們難過輕松的探索大數據。
您企業可以通過提供BI解決方案來實現這一點：
允許業務部門的用戶直觀地訪問到所需的數據，而不需要依靠IT來運行查詢和生成報告。
並提供自然語言搜索功能，便於查找他們所需的信息。
發現不同來源的數據之間的連接和關系——甚至是以意外的方式發現不相關的數據。
用清晰簡潔的方式實現數據的可視化和形象化。
何為自然語言搜索，其如何為企業提供幫助?
藉助自然語言搜索，用戶可以使用常規口語進行查詢。這對於缺乏數據專業知識，並且可能並不知道在資料庫中如何查找精確信息所需的技術術語的用戶極其有用。包含此功能的BI解決方案使更多的用戶(而不僅僅是數據科學家)能夠從企業的大數據中獲得洞察分析能力。
五、促進企業部門間的協作，以推動創新
一項偉大的發現如果不能共享，又有什麼益處呢?如果您企業內部的相關人員不能與更廣泛的同事們分享他們的見解，那麼您企業無疑錯過了最佳的推動部門間合作的機會，也不利於這些好的最初的想法理念進一步的擴展，並使其更好。更糟糕的是，如果其他的同事沒有聽說過您的發現，他們最終可能會重復類似的數據探索，進而導致企業生產力的下降。
但僅僅分享數據是不夠的，您企業必須以正確的方式分享數據。
考慮採用一款「企業就緒」的商業智能解決方案——其既能夠提供自助分析的自由度(允許每位用戶在他們認為合適的時候探索和共享數據)，同時還能夠為企業提供全面的治理能力(控制誰有許可權訪問哪些數據信息，所以每位員工都能夠基於單一的事實來源開展工作)。
通過在自助服務和大數據管理之間取得平衡，您企業可以充分利用整個企業組織的集體智慧，結合多個團隊和個人的專業知識來傳播新的想法和理念，促進討論，並推動創新。
確保企業的BI解決方案得到妥善管理：
有效的數據治理可確保在整個企業組織內正確控制和管理對分析功能和對於大數據的訪問。
如果缺乏適當的大數據治理水平，就會出現錯誤、變化和冗餘，進而導致用戶難以驗證數據中的真實情況，從而導致延遲和中斷。
正確的大數據治理可以幫助您企業避免發生上述的不一致，並確保每位員工都能夠從相同的可信數據中獲得他們所需的洞察分析。
六、打造靈活敏捷的分析環境，以切實滿足每位用戶的需求
保持與大數據所提供的大量新信息的同步是一個不小的挑戰。大數據的猛烈沖擊可能會使商業用戶難以真正深入的挖掘，探索並及時獲得他們所需的答案。
為了保持活力，您企業應該考慮創建靈活敏捷分析環境，您的IT團隊可以快速並逐步構建BI解決方案，以應對業務用戶不斷變化的需求。
例如，隨著用戶對數據更加熟悉，您企業可能需要從指導分析發展到自助服務BI。
這使他們能夠自行探索更多的大數據，並更快速地深入細節。使用靈活的框架，您企業可以輕松的滿足這些用戶的需求，而無需花費大量成本或開發時間。
七、確保用戶能夠在任何設備上隨時隨地訪問分析解決方案
隨著手機、平板電腦和筆記本電腦的計算能力的不斷增強，企業員工們越來越多地在辦公室之外進行業務的處理。
無論是在火車上，在機場候機廳還是在客戶會議上，現在的企業業務團隊都希望能夠在任何業務需要的時候訪問他們的工作資料。
為了滿足這些需求，您企業需要能夠以各種形式向客戶和用戶提供分析解決方案——確保他們無論何時何地，對於所需全部功能都能夠得到滿足的期望。
除了通過基於雲服務或在線門戶提供對分析解決方案的直接訪問之外，確保用戶能夠在任何地方均能夠實現順利訪問的另一種方式是在企業的嵌入式分析應用程序中使用開放式API。通過在用戶的日常工作環境中提供強大的分析功能，您可以確保每位業務用戶都可以在他們需要時隨時訪問所需的信息。
自助服務商業智能為大眾帶來了分析的力量，但對於一些用戶來說，獲得額外的應用程序則可能是一大真正的挑戰。這就是為什麼有些產品和組織直接將分析嵌入到用戶每天所使用的熟悉的環境或應用程序中的原因所在了。
八、部署實施可隨企業業務需求不斷變化的可擴展的解決方案
通常情況下，企業所收集的大數據的量只會越來越大。但無論數據存儲庫怎麼擴展，您的用戶都希望獲得順暢的訪問體驗，而不必等待很長時間或經歷中斷。隨著數據集的不斷增長，大多數工具都難以跟上這一需求。
為了確保用戶能夠以他們想要的方式繼續探索數據，請採用可隨需擴展的BI平台，即使數據量增加並且應用程序變得更加復雜，也可以提供出色的性能。該平台應該採用多種工具和方法，以便您企業可以保持為最終用戶提供互動式的動態體驗，而不管您企業產生了多少數據。
此外，尋找一款使用內存處理執行即時計算的商業智能解決方案。
這些解決方案可以以「思考速度」處理和回答問題，使用戶可以不斷的保持繼續的挖掘和探索。這反過來可以在整個企業組織內推動勇於開拓創新和探索的企業文化。
何為內存中的處理，其能夠為企業組織帶來什麼樣幫助：
內存資料庫 (in-memory database) 是一種數據處理技術，其在隨機存取存儲器(RAM)中暫時存儲和計算信息，而無需在每次用戶進行新的選擇或計算時都從磁碟存儲中提取數據。數據可以在RAM中更快速地讀取和分析，從而使得較之採用更傳統的方法，報告(和決策制定)更快。
九、確保您企業的BI解決方案可以輕松適應未來的技術
管理和探索大數據的技術正在迅速改變，以便為當下的企業客戶提供更好，更快的解決方案，進而從大數據中獲取洞察分析。但是將最新技術整合到現有的分析平台中可能具有挑戰性，有時甚至是不可能的。故而企業應該確保您所採用的分析解決方案能夠快速，輕松地與新技術實現集成。
例如，開放的API可以為您企業的現有解決方案帶來新的功能，就像添加幾行代碼一樣簡單。擁有專注於定製開發的在線社區也很重要。由此，開發人員們可以通過與其他人員輕松協作來確保您的產品或解決方案能夠與最新的技術進步保持同步。
什麼是開放式API?
一款開放的API是一個公開的介面，開發人員可以使用它將第三方解決方案集成到他們自己的解決方案中。實質上，開放式API能夠控制兩款不同的應用程序如何輕松地進行通信，並相互交互。提供開放式API的BI解決方案使企業能夠輕松插入多種解決方案，執行獨立解決方案所無法實現的特定功能。
十、選擇具有廣泛合作夥伴生態系統的商務智能解決方案
當涉及到大數據項目時，有時候企業需要一點額外的幫助才能看到整體的狀況。在選擇商業智能解決方案時，企業務必需要尋找能夠與大量多種技術維持合作關系的供應商。
這將有助於簡化數據交互，確保您企業的所有BI解決方案能夠高效地工作。此外，擁有足夠的合作夥伴可以隨時為您企業的業務需求提供最合適的解決方案——無論現在還是未來。
您企業應選擇哪些類型的技術合作夥伴?
數據存儲和管理解決方案提供商可存儲和查詢您企業的數據，並提供運行分析解決方案所需的基礎架構。
數據整理(Data wrangling)解決方案提供商將原始數據精煉，並重塑為可用數據集。
機器學習解決方案提供商通過使用從數據迭代學習的演算法來自動化分析模型構建。
大數據，大潛力
大數據有可能改變您企業的業務，但為了能夠真正從貴公司的大數據項目中獲得真正的價值，您企業需要知道如何充分利用大數據。
恰當的商業智能解決方案可以幫助您企業最大化您的大數據投資回報，其方法是：
提供完整的業務視圖和影響企業業務的外部因素。
在您的業務的每個領域推動更好的以數據為導向的決策。
讓更多的業務用戶能夠隨時隨地訪問和探索大數據。
在整個企業組織中培養協作、積極開拓探索和創新的企業文化。
隨著業務的增長而實現規模化的擴展，以滿足未來的需求。

③ 介紹一下海量數據的處理方法

介紹一下海量數據的處理方法
適用范圍：可以用來實現數據字典，進行數據的判重，或者集合求交集
基本原理及要點：
對於原理來說很簡單，位數組+k個獨立hash函數。將hash函數對應的值的位數組置1，查找時如果發現所有hash函數對應位都是1說明存在，很明顯這個過程並不保證查找的結果是100%正確的。同時也不支持刪除一個已經插入的關鍵字，因為該關鍵字對應的位會牽動到其他的關鍵字。所以一個簡單的改進就是 counting Bloom filter，用一個counter數組代替位數組，就可以支持刪除了。
還有一個比較重要的問題，如何根據輸入元素個數n，確定位數組m的大小及hash函數個數。當hash函數個數k=(ln2)*(m/n)時錯誤率最小。在錯誤率不大於E的情況下，m至少要等於n*lg(1/E)才能表示任意n個元素的集合。但m還應該更大些，因為還要保證bit數組里至少一半為0，則m應該>=nlg(1/E)*lge 大概就是nlg(1/E)1.44倍(lg表示以2為底的對數)。
舉個例子我們假設錯誤率為0.01，則此時m應大概是n的13倍。這樣k大概是8個。
注意這里m與n的單位不同，m是bit為單位，而n則是以元素個數為單位(准確的說是不同元素的個數)。通常單個元素的長度都是有很多bit的。所以使用bloom filter內存上通常都是節省的。
擴展：
Bloom filter將集合中的元素映射到位數組中，用k（k為哈希函數個數）個映射位是否全1表示元素在不在這個集合中。Counting bloom filter（CBF）將位數組中的每一位擴展為一個counter，從而支持了元素的刪除操作。Spectral Bloom Filter（SBF）將其與集合元素的出現次數關聯。SBF採用counter中的最小值來近似表示元素的出現頻率。
問題實例：給你A,B兩個文件，各存放50億條URL，每條URL佔用64位元組，內存限制是4G，讓你找出A,B文件共同的URL。如果是三個乃至n個文件呢?
根據這個問題我們來計算下內存的佔用，4G=2^32大概是40億*8大概是340億，n=50億，如果按出錯率0.01算需要的大概是650億個bit。現在可用的是340億，相差並不多，這樣可能會使出錯率上升些。另外如果這些urlip是一一對應的，就可以轉換成ip，則大大簡單了。
2.Hashing
適用范圍：快速查找，刪除的基本數據結構，通常需要總數據量可以放入內存
基本原理及要點：
hash函數選擇，針對字元串，整數，排列，具體相應的hash方法。
碰撞處理，一種是open hashing，也稱為拉鏈法；另一種就是closed hashing，也稱開地址法，opened addressing。
擴展：
d-left hashing中的d是多個的意思，我們先簡化這個問題，看一看2-left hashing。2-left hashing指的是將一個哈希表分成長度相等的兩半，分別叫做T1和T2，給T1和T2分別配備一個哈希函數，h1和h2。在存儲一個新的key時，同時用兩個哈希函數進行計算，得出兩個地址h1[key]和h2[key]。這時需要檢查T1中的h1[key]位置和T2中的h2[key]位置，哪一個位置已經存儲的（有碰撞的）key比較多，然後將新key存儲在負載少的位置。如果兩邊一樣多，比如兩個位置都為空或者都存儲了一個key，就把新key 存儲在左邊的T1子表中，2-left也由此而來。在查找一個key時，必須進行兩次hash，同時查找兩個位置。
問題實例：1).海量日誌數據，提取出某日訪問網路次數最多的那個IP。

IP的數目還是有限的，最多2^32個，所以可以考慮使用hash將ip直接存入內存，然後進行統計。

3.bit-map

適用范圍：可進行數據的快速查找，判重，刪除，一般來說數據范圍是int的10倍以下

基本原理及要點：使用bit數組來表示某些元素是否存在，比如8位電話號碼

擴展：bloom filter可以看做是對bit-map的擴展

問題實例：

1)已知某個文件內包含一些電話號碼，每個號碼為8位數字，統計不同號碼的個數。

8位最多99 999 999，大概需要99m個bit，大概10幾m位元組的內存即可。

2)2.5億個整數中找出不重復的整數的個數，內存空間不足以容納這2.5億個整數。

將bit-map擴展一下，用2bit表示一個數即可，0表示未出現，1表示出現一次，2表示出現2次及以上。或者我們不用2bit來進行表示，我們用兩個bit-map即可模擬實現這個2bit-map。

4.堆

適用范圍：海量數據前n大，並且n比較小，堆可以放入內存

基本原理及要點：最大堆求前n小，最小堆求前n大。方法，比如求前n小，我們比較當前元素與最大堆里的最大元素，如果它小於最大元素，則應該替換那個最大元素。這樣最後得到的n個元素就是最小的n個。適合大數據量，求前n小，n的大小比較小的情況，這樣可以掃描一遍即可得到所有的前n元素，效率很高。

擴展：雙堆，一個最大堆與一個最小堆結合，可以用來維護中位數。

問題實例：
1)100w個數中找最大的前100個數。

用一個100個元素大小的最小堆即可。

5.雙層桶劃分

適用范圍：第k大，中位數，不重復或重復的數字

基本原理及要點：因為元素范圍很大，不能利用直接定址表，所以通過多次劃分，逐步確定范圍，然後最後在一個可以接受的范圍內進行。可以通過多次縮小，雙層只是一個例子。

擴展：

問題實例：
1).2.5億個整數中找出不重復的整數的個數，內存空間不足以容納這2.5億個整數。

有點像鴿巢原理，整數個數為2^32,也就是，我們可以將這2^32個數，劃分為2^8個區域(比如用單個文件代表一個區域)，然後將數據分離到不同的區域，然後不同的區域在利用bitmap就可以直接解決了。也就是說只要有足夠的磁碟空間，就可以很方便的解決。

2).5億個int找它們的中位數。

這個例子比上面那個更明顯。首先我們將int劃分為2^16個區域，然後讀取數據統計落到各個區域里的數的個數，之後我們根據統計結果就可以判斷中位數落到那個區域，同時知道這個區域中的第幾大數剛好是中位數。然後第二次掃描我們只統計落在這個區域中的那些數就可以了。

實際上，如果不是int是int64，我們可以經過3次這樣的劃分即可降低到可以接受的程度。即可以先將int64分成2^24個區域，然後確定區域的第幾大數，在將該區域分成2^20個子區域，然後確定是子區域的第幾大數，然後子區域里的數的個數只有2^20，就可以直接利用direct addr table進行統計了。

6.資料庫索引

適用范圍：大數據量的增刪改查

基本原理及要點：利用數據的設計實現方法，對海量數據的增刪改查進行處理。
擴展：
問題實例：

7.倒排索引(Inverted index)

適用范圍：搜索引擎，關鍵字查詢

基本原理及要點：為何叫倒排索引?一種索引方法，被用來存儲在全文搜索下某個單詞在一個文檔或者一組文檔中的存儲位置的映射。

以英文為例，下面是要被索引的文本：
T0 = 「it is what it is」
T1 = 「what is it」
T2 = 「it is a banana」
我們就能得到下面的反向文件索引：
「a」: {2}
「banana」: {2}
「is」: {0, 1, 2}
「it」: {0, 1, 2}
「what」: {0, 1}
檢索的條件」what」, 「is」和「it」將對應集合的交集。

正向索引開發出來用來存儲每個文檔的單詞的列表。正向索引的查詢往往滿足每個文檔有序頻繁的全文查詢和每個單詞在校驗文檔中的驗證這樣的查詢。在正向索引中，文檔占據了中心的位置，每個文檔指向了一個它所包含的索引項的序列。也就是說文檔指向了它包含的那些單詞，而反向索引則是單詞指向了包含它的文檔，很容易看到這個反向的關系。

擴展：

問題實例：文檔檢索系統，查詢那些文件包含了某單詞，比如常見的學術論文的關鍵字搜索。

8.外排序

適用范圍：大數據的排序，去重

基本原理及要點：外排序的歸並方法，置換選擇敗者樹原理，最優歸並樹

擴展：

問題實例：
1).有一個1G大小的一個文件，裡面每一行是一個詞，詞的大小不超過16個位元組，內存限制大小是1M。返回頻數最高的100個詞。

這個數據具有很明顯的特點，詞的大小為16個位元組，但是內存只有1m做hash有些不夠，所以可以用來排序。內存可以當輸入緩沖區使用。

9.trie樹

適用范圍：數據量大，重復多，但是數據種類小可以放入內存

基本原理及要點：實現方式，節點孩子的表示方式

擴展：壓縮實現。

問題實例：
1).有10個文件，每個文件1G，每個文件的每一行都存放的是用戶的query，每個文件的query都可能重復。要你按照query的頻度排序。

2).1000萬字元串，其中有些是相同的(重復),需要把重復的全部去掉，保留沒有重復的字元串。請問怎麼設計和實現?

3).尋找熱門查詢：查詢串的重復度比較高，雖然總數是1千萬，但如果除去重復後，不超過3百萬個，每個不超過255位元組。

10.分布式處理 maprece

適用范圍：數據量大，但是數據種類小可以放入內存

基本原理及要點：將數據交給不同的機器去處理，數據劃分，結果歸約。

擴展：

問題實例：

1).The canonical example application of MapRece is a process to count the appearances of

each different word in a set of documents:
void map(String name, String document):
// name: document name
// document: document contents
for each word w in document:
EmitIntermediate(w, 1);

void rece(String word, Iterator partialCounts):
// key: a word
// values: a list of aggregated partial counts
int result = 0;
for each v in partialCounts:
result += ParseInt(v);
Emit(result);
Here, each document is split in words, and each word is counted initially with a 「1″ value by

the Map function, using the word as the result key. The framework puts together all the pairs

with the same key and feeds them to the same call to Rece, thus this function just needs to

sum all of its input values to find the total appearances of that word.

2).海量數據分布在100台電腦中，想個辦法高效統計出這批數據的TOP10。

3).一共有N個機器，每個機器上有N個數。每個機器最多存O(N)個數並對它們操作。如何找到N^2個數的中數(median)?

經典問題分析

上千萬or億數據（有重復），統計其中出現次數最多的前N個數據,分兩種情況：可一次讀入內存，不可一次讀入。

可用思路：trie樹+堆，資料庫索引，劃分子集分別統計，hash，分布式計算，近似統計，外排序

所謂的是否能一次讀入內存，實際上應該指去除重復後的數據量。如果去重後數據可以放入內存，我們可以為數據建立字典，比如通過 map，hashmap，trie，然後直接進行統計即可。當然在更新每條數據的出現次數的時候，我們可以利用一個堆來維護出現次數最多的前N個數據，當然這樣導致維護次數增加，不如完全統計後在求前N大效率高。

如果數據無法放入內存。一方面我們可以考慮上面的字典方法能否被改進以適應這種情形，可以做的改變就是將字典存放到硬碟上，而不是內存，這可以參考資料庫的存儲方法。
當然還有更好的方法，就是可以採用分布式計算，基本上就是map-rece過程，首先可以根據數據值或者把數據hash(md5)後的值，將數據按照范圍劃分到不同的機子，最好可以讓數據劃分後可以一次讀入內存，這樣不同的機子負責處理各種的數值范圍，實際上就是map。得到結果後，各個機子只需拿出各自的出現次數最多的前N個數據，然後匯總，選出所有的數據中出現次數最多的前N個數據，這實際上就是rece過程。
實際上可能想直接將數據均分到不同的機子上進行處理，這樣是無法得到正確的解的。因為一個數據可能被均分到不同的機子上，而另一個則可能完全聚集到一個機子上，同時還可能存在具有相同數目的數據。比如我們要找出現次數最多的前100個，我們將1000萬的數據分布到10台機器上，找到每台出現次數最多的前 100個，歸並之後這樣不能保證找到真正的第100個，因為比如出現次數最多的第100個可能有1萬個，但是它被分到了10台機子，這樣在每台上只有1千個，假設這些機子排名在1000個之前的那些都是單獨分布在一台機子上的，比如有1001個，這樣本來具有1萬個的這個就會被淘汰，即使我們讓每台機子選出出現次數最多的1000個再歸並，仍然會出錯，因為可能存在大量個數為1001個的發生聚集。因此不能將數據隨便均分到不同機子上，而是要根據hash 後的值將它們映射到不同的機子上處理，讓不同的機器處理一個數值范圍。
而外排序的方法會消耗大量的IO，效率不會很高。而上面的分布式方法，也可以用於單機版本，也就是將總的數據根據值的范圍，劃分成多個不同的子文件，然後逐個處理。處理完畢之後再對這些單詞的及其出現頻率進行一個歸並。實際上就可以利用一個外排序的歸並過程。
另外還可以考慮近似計算，也就是我們可以通過結合自然語言屬性，只將那些真正實際中出現最多的那些詞作為一個字典，使得這個規模可以放入內存。

④ 現在都流行說大數據，那怎麼樣可以讓大量的數據可視化呢用什麼工具可以做到

可以利用工具，未至科技鸚鵡可分析文章關鍵詞並賦予權重，自動總結文章主題，將連續的自然語言文本切分成具有語義合理性和完整性的詞彙序列；將文本中特定類型的事物名稱或符號識別出來。目前已應用於多個行業領域，同時也包括一些通用領域如人名、地名、機構名、時間日期等。

⑤ 數據可視化的16個經典案例

[數據可視化]

本文編譯自：Ross Crooks

數據可視化是指將數據以視覺的形式來呈現，如圖表或地圖，以幫助人們了解這些數據的意義。通過觀察數字、統計數據的轉換以獲得清晰的結論並不是一件容易的事。而人類大腦對視覺信息的處理優於對文本的處理——因此使用圖表、圖形和設計元素，數據可視化可以幫你更容易的解釋數據模式、趨勢、統計數據和數據相關性，而這些內容在其他呈現方式下可能難以被發現。

數據可視化可以是靜態的或交互的。幾個世紀以來，人們一直在使用靜態數據可視化，如圖表和地圖。互動式的數據可視化則相對更為先進：人們能夠使用電腦和移動設備深入到這些圖表和圖形的具體細節，然後用交互的方式改變他們看到的數據及數據的處理方式。

我們必須用一個合乎邏輯的、易於理解的方式來呈現數據。但是，並非所有數據可視化作品的效果都一樣好。那麼，如何將數據組織起來，使其既有吸引力又易於理解？讓我們通過下面的16個有趣的例子獲得啟發，它們是既注重風格也注重內容的數據可視化經典案例。

1：為什麼會有「巴士群」現象

這里有一個關於復雜數據集的很好的例子，它看起來感覺像一個游戲。在這個例子里，Setosa網站為我們呈現了「巴士群」現象是如何發生的，即當一輛巴士被延遲，就會導致多輛巴士在同一時間到站。

只用數字講述這個故事是非常困難的，所以取而代之的是，他們把它變成一個互動游戲。當巴士沿著路線旋轉時，我們可以點擊並按住一個按鈕來使巴士延遲。然後，我們所要做的就是觀察一個短暫的延遲如何使巴士在一段時間以後聚集起來。

2：世界上的語言

這個由DensityDesign設計的互動作品令人印象深刻，它將世界上眾多(或者說，我們大多數人)語言用非語言的方法表現出來，一共有2678種。

這件作品可以讓你瀏覽使用共同語言的家庭，看看哪些語言是最常用的，並查看語言在世界各地的使用范圍。這是一種了不起的視覺敘事方法：將一個有深度的主題用一種易於理解的方式進行解讀。

3：按年齡段分布的美國人口百分比

應該用什麼方式去呈現一種單一的數據？這是一個令人信服的好榜樣。

Pew Research創造了這個GIF動畫，顯示人口統計數量隨著時間推移的的變化。這是一個好方法，它將一個內容較多的故事壓縮成了一個小的動圖包。此外，這種類型的微內容很容易在社交網路上分享或在博客中嵌入，擴大了內容的傳播范圍。

4：NFL(國家橄欖球聯盟)的完整歷史

體育世界有著豐富的數據，但這些數據並不總是能有效地呈現。然而，FiveThirtyEight網站做得特別好。

在下面這個互動式可視化評級中，他們對國家橄欖球聯盟史上的每一場比賽計算「等級分」 – – 根據比賽結果對球隊實力進行簡單的衡量。總共有超過30,000個評級，觀眾可以通過比較各個隊伍的等級分來了解每個隊伍在數十年間的比賽表現。

5：Google Flights 上的美國感恩節

下面是將一段時間內在空中移動的物體進行可視化的好方法。這是由Google Trends驅動的項目，它跟蹤感恩節前出發、到達和穿越美國的航班。

可視化始於當天很早的時間，隨著時間的推移，像播放電影一樣顯示在全國各地飛行中的航班。不需要顯示時間外的任何數字，觀眾即可以看到當天哪段時間是國際航班、國內航班以及往返於全國各地不同樞紐的航班的熱門時間。

6：是什麼真正造成了全球變暖?

我們都知道，「不要只簡單地展示數據，講個故事吧」。這正是彭博商業正在做的可視化 ——用互動的方式來講述故事的來龍去脈。。

此圖的關鍵是要反駁用自然原因解釋全球變暖的理論。首先你會看到從1880年至今觀測到的溫度上升情況。為了使故事內容更加豐富，當你向下滾動時，這個可視化圖會讓你清楚的了解到相較於已被觀測到的因素，造成全球變暖的不同因素到底有多少。作者希望觀眾能夠得到非常清晰的結論。

7：在敘利亞，誰和誰在戰斗？

許多不同的團體之間的關系可能令人很難理解 – 尤其是當有11個這樣的團體存在的時候。這些團體之間有的結盟，有的敵對，反之亦然。這讓人難以理解。

但是，Slate網站通過表格的形式和熟悉的視覺表達，將這些數據簡化為一種簡單的、易於理解和可交互的形式。觀眾可以點擊任一張臉來查看雙方關系的簡要描述。

8：最有價值的運動隊

這是通過疊加數據來講述深層故事的一個典型例子。

這個交互由Column Five設計，受福布斯「2014年最具價值的運動隊50強」名單得到的啟發。但是它不僅將列表可視化，用戶還可以通過它看到每支隊伍參賽的時間以及奪得總冠軍的數量。這為各隊的歷史和成功提供了更全面的概況信息。

9：美國風圖

下面是一個類似感恩節航班的可視化圖，除了圖中顯示的時刻，它還能實時顯示美國本土的風速和風向。

它是直觀設計的一個很好的案例：風速用線條移動的快慢來表示，方向通過線條移動的路徑來表示。它會即時顯示美國風向的總體趨勢，無需任何數字，除非你在地圖上點擊滑鼠。另外，使用時設定最多兩個變數會使它更容易操作。

10：政治新聞受眾渠道分布圖

據Pew研究中心稱，當設計師在信息內容很多又不能刪的時候，他們通常會把信息放到數據表中，以使其更緊湊。但是，他們在這里使用分布圖來代替。

為什麼呢？因為分布圖可以讓觀眾在頻譜上看到每個媒體的渠道。在分布圖上，每個媒體的渠道之間的距離尤為顯著。如果這些點僅僅是在表中列出，那麼觀眾就無法看到每個渠道之間的對比效果。

11：著名創意人士的日程安排

這個數據可視化圖是用奇特的想法描繪出的一個簡單概念。這個表格利用Mason Currey的《日常慣例》一書中的信息展示了那些著名創意人士的日程安排，解讀其時間和活動安排。這不僅是一個數據分析的例子(因為你可以通過單獨的活動來瀏覽日程安排)，也是一個品牌宣傳的佳作。

12：今年發生了哪些新聞?

最好的數據可視化方式，就是用直觀和美麗的方式傳達信息。Echelon Insights致力於這一方式，將2014年Twitter上最受關注的新聞進行了可視化。

1億8450萬條推文是什麼樣子？就是如下圖所示的藝術品。

13：問題的深度

當你想強調規模的時候，靜態數據可視化是表達你的觀點的極佳方式。下面這張來自《華盛頓郵報》的信息圖長得令人難以置信…這是故意的。他們在圖中展示了一架飛機可以探測到的深海信號是多麼的深，通過比較飛機的探測深度與高層建築、已知哺乳動物的最大深度、泰坦尼克號沉船的深度等。這是簡單的視覺效果和顏色梯度的極佳使用方式。

最後，將數據添加到新聞報道中(文中為失蹤的馬航)是提供背景的好方式。

14：前沿預算

上述圖表相對簡單，以下是創造設計精緻的、傳遞大量數據的圖表的方法。秘訣何在？——用簡單和干凈的格式，便於讀者理解數據。

這個由GOOD Magazine 和 Column Five製作的圖表，解讀了NASA的五年預算，顯示資金將怎麼花、花在哪裡。此外，它還有一個主題設計，這真是一個全面成功的作品！

15： Kontakladen慈善年報

不是所有的數據可視化都需要用動畫的形式來表達。當現實世界的數據通過現實生活中的例子進行可視化，結果會令人驚嘆。設計師Marion Luttenberger把包含在Kontakladen慈善年報中的數據以一種獨特的方法表現出來。

該組織為奧地利的吸毒者提供支持，所以Luttenberger就通過現實生活中的視覺元素來宣傳他們的使命。例如，這輛購物車的形象表現出受助者每一天可以負擔得起多少生活必需品。

16：奧地利太陽能年報

雖然有許多方法都能使數據可視化，但是其中，使用真實信息主體去創建數據可視化作品的做法非常了不起。這份來自Austria Solar的年度報告，通過在頁面上使用太陽光感墨水，用真正的太陽能給公司數據賦予生命。

一句話總結：他們是天才。

⑥ 如何讓excel表中數值都變成統一的文本格式

把文本格式批量轉換為數值格式，步驟是：

在空白單元格中輸入1，右擊該單元格、復制，然後選文本型數字區域，右擊，「選擇性粘貼」注意勾選「乘」。

具體操作見圖

⑦ 如何練就融會貫通的能力

在討論融會貫通之前，首先應該先明確一下，我們期望融會貫通可以看到山背後的那道彎了，這是什麼狀況？

突然有一天，你能夠想清楚過去一直困擾你的問題，你能夠條分縷析了，有人說這就是通了，你究竟通的是什麼？

這種狀態往往就是我們所說的融會貫通，而貫通的就是大腦中的各種知識。

1.知識是什麼？

大數據時代，似乎一夜之間，各行各業都開始討論數據，都開始研究如何讓數據成為自己發家致富的工具，讓數據成為簡化辦事流程的重要抓手，讓數據成為連接政府與百姓的橋梁，讓數據成為支撐企業、政府高效辦公的重要基礎。

但究竟什麼是數據呢？

互聯網上關於數據的定義很多，但用句文雅的詞來形容，普遍比較學術化，直白一點說，普遍讓人看不懂，再說的感性一點，就是普遍不說人話，這可能也是某些學術領域一直被人詬病的地方吧。

其實，無論物質層面、精神層面，所有摸得著看得見、摸不著看不見的那些東西，都可以稱為數據，用句有點文學化的語言，世間萬物皆數據——這話當然也不是我說的。

說完了數據，再談論與數據關聯最緊密的信息。

所謂信息，就是那些經過加工處理、有邏輯有價值的數據。

數據只是那些最原始的記錄，具體這些數據之間有什麼關系，相互之間有什麼聯系，就需要人工進行分析處理，只有處理之後的數據才有意義，才能夠為我所用。

從這個角度來說，大數據時代似乎有點不合適，僅僅大數據並不能直接給我們提供幫助，關鍵是數據背後的信息才是我們真正需要的，才是能夠提升我們的工作生活質量，提升社會效率的關鍵，所以與其說大數據時代，不如說大信息時代更為妥當。

有了信息是否就可以了呢？

顯然還不夠，獲得信息只是最基本的一步，這些信息是否有價值，還需要通過歸納、演繹、比較等手段進行挖掘，找到那些有價值的部分，沉澱下來並與已知的知識體系結合，只有這樣，這些信息才能夠轉變成知識。

而真正促進社會發展進步，真正讓人類從猿人一步步進化成高等動物，並且還在慢慢進化，最關鍵最重要的就是知識的積累。

那麼，知識的具體涵義是什麼？

李笑來的定義如下：所謂知識，就是能夠指導我們做出更好決策，並且從長期來看更可能給我們帶來更好結果的那些信息。

這個定義中有三個關鍵部分：

一是知識來自信息；

二是能夠指導我們做出更好決策，翻譯過來就是有用；

三是長期來看可以帶來更好結果，翻譯過來就是長期有用。

根據這個定義，也就有了分辨知識的最基本方法：

一是知道這些後，哪些決策會發生改變？

當然這里也有一些小問題，決策發生改變，如何保證這些改變是向著更好的方向變化呢？

二是長期來看，這些東西能夠為自己帶哪些想到或者想不到的好處呢？

長期來看能夠想到的好處，自然是好的，也是我們努力的方向，尋找知識的目的，但那些意想不到的好處，又怎麼能夠提前想到呢？

所以，得到長期來看能夠想得到的好處，這才是我們的出發點，也是能夠把握的東西，至於那些意想不到的好處，就當這個世界給我們的驚喜好了。

必定人生處處有驚喜嘛。

2.知識融會貫通的實質是什麼？

根據網路解釋，所謂融會貫通，就是各方面的知識或道理融合貫穿起來，從而得到系統透徹的理解。

融會貫通最典型的表現就是知識遷移，即表面上不完全屬於一類甚至根本不相關的知識，由於找到了某種共通性，進而把一個領域的知識遷移到其他領域，實現了所謂一通百通的效果。

按照現代大腦研究成果，所謂的融會貫通，很可能就是那些本來關聯度不高甚至完全不相關的知識，在某種機制下建立了所謂的「大腦溝回」，那些豁然開朗、靈光一現、頓悟的狀態，很可能就是多個知識點產生連接的結果。

「面對同一件事，別人能看到一點，你能看到五點；別人能看到五點，你能看到這五點之間的聯系；別人能看到這五點之間的聯系，你還能看到這件事的五點和另外一件事的三點的內在關系……」

我又使用來自《學會寫作》的這段話了，其中的那個你，就是典型的把知識融會貫通的表現。

相信很多人都有類似體會，同一時間面對同一件事情，有些人就是能夠擁有更多的啟發，就是能夠產生更多的想法，就是能夠給出更好的意見建議，而大多數人也只能是兩眼放光，除了羨慕和嫉妒，還有就是對自己的憤怒和無助。

很多人不得不發出感慨，同樣是一個腦袋，為什麼別人就能想到，而我想不到呢，為什麼差距就這么大呢？

3.如何促進知識融會貫通？

既然融會貫通的本質就是讓知識之間產生連接，顯然促進融會貫通的方法，就是想辦法增加知識之間的連接。

（1）多學習，掌握更多知識

按照常識就知道，大腦中掌握的知識點越多，兩點之間產生連接的可能性自然就越多。

所以，促進產生更多連接的成本最低的方法，就是盡可能增加知識點。

把這個策略翻譯一下，就是越博學的人，產生融會貫通的機會越大。

生活中就是有不少這種人，在講話過程中，他們能夠引經據典，各種典故隨手拈來，各種名言警句金句似乎根本不用經過大腦，隨用隨取。

在贊嘆這些人強大記憶力的同時，我們也應該反思，或許正是因為平時大量積累，在有意無意中，這些知識產生了連接貫通，相關的相似的相反的已經產生了聯系，所以在調取的時候根本不需要去搜索去回憶，達到了那種隨手拈來的效果。

（2）多鏈接，讓知識產生關聯

正常情況下，對於大腦什麼時候才能夠讓那些知識點產生連接，這個我們往往無法控制，至少從目前對大腦的研究來看，可能還會有非常遠的路要走。

而對於這種完全依賴大腦自行連接知識點的過程，我稱為知識的被動連接。

顯然，對於極度渴望成長的人來說，這樣的效率太低了。

我們曾經討論過一個話題，盡管快速成功不可能，事物有其必然的發展規律，不可能遵守你的意願。

但我們也提到，快速入門是非常有可能，而且非常有必要，並且每個人都應該努力追求的效果。

盡可能產生更多連接的另外一個更加主動的方式，就是有意識讓大腦中的知識建立連接，也就是不在被動等待大腦自行完成連接，而是主動促進各知識點的連接。

這個方法說起來還特別簡單，就是遇到任何知識點，經常問自己一個問題：這個知識還能夠用在什麼地方？

解答這個問題的過程，實質上就是主動讓大腦中現存知識建立連接的過程，不用擔心自己主動建立的連接可能不夠准確，大腦形成的這些連接，最終還是要經過實踐的檢驗，才能真正成為我們積累的財富。

不知道你是否有過類似經歷，當年上學的時候，特別是學英語期間，我喜歡玩一個自我聯想的游戲，經常在一張白紙上，寫下一個單詞，然後開始聯想跟這個單詞相關的還有哪些單詞，意思相近的，、相反的，外表長的像的，經常一起出現的，等等。

當時只是覺得好玩，並且這樣處理過的單詞似乎記的更牢固，不需要刻意背誦，也很難忘記，現在想來，那其實就是一種主動建立連接的過程。

總之，知識點很重要，沒有數量哪來的連接，就跟寫作一樣，在沒有寫夠百萬字之前，根本沒有資格大談特談寫作技巧，積累不夠，看起來無比有道理的那些別人總結的經驗技巧，你看的再多，也很難成為你的知識，你也很難應用到自己的寫作。

擁有了知識點還要主動讓其產生連接，成為有用的知識，必定孤零零在那的知識，我們很難調用，它自己也很孤單，人害怕孤單孤獨，它也一樣，一旦獨自待的太久，或者性格蟬聲變化，或者乾脆一不小心冬眠，或者乾脆溜走，那我們不就白費功夫了，你說呢。

⑧ 電子表格中出現很長的一列數據，怎樣才能將這些數據歸攏到一起，讓整體看上去不那麼長

如果是在一個格子里的可以點擊自動換行試下，就會根據列寬保持列寬自動轉到下一行，下下一行顯示；如果是很長的一列，可以分成多個表格顯示。

⑨ 如何使用Excel讓數據對比更加一目瞭然

我們在使用Excel時，如何能做出清晰明了的報告總結呢？如果是一份好的報告總結，總是能夠幫助大家直觀的理解數據的含義。本文就教大家在Excel軟體中做出更加直觀的數據對比報告，漲了多少、跌了多少，一看便知。有需要的朋友一起去看看吧！

這個問題其實並不困難，Excel提供了近乎無限的可能性。比如我們例子中的這個圖表，你不僅可以看到每組數據的情況，還能通過圖表箭頭看到漲跌差距，一目瞭然。想讓自己的圖表也具備更強說服力，那就要對當前圖表動動手腳了。

1、首先，正常根據數據製作圖表。圈選數據，點擊切換選項卡到插入，點擊柱狀圖選中“簇狀柱形圖”。

2、在柱狀圖中單擊網格線刪除以保持圖表頁面清潔，此時右鍵單擊圖表中任意一個數據柱狀圖，選擇“設置數據系列格式”，調整“系列重疊”為“-10%”，“分類間距”為“100%”。

3、在表格旁新建三個輔助列，分別為X軸、Y軸1、Y軸2。具體設置如下：

X軸：1.1、1.2、1.3、1.4，這部分有多少行就要設置多少個，以此類推

Y軸1：=IF（C2＜B2，C2+2，NA（）），如果C2＜B2，那麼該列數據為C2+2，否則返回錯誤值 #N/A，當然，如果你願意，也可以設置為+1、+3，這個的作用是箭頭在柱狀圖表上方的位置，根據自己需求設置即可，確定後，按住Ctrl+滑鼠左鍵點選拉動單元格向下覆蓋整列到數據尾行。

Y軸2：=IF（C2》=B2，C2+2，NA（））。如果C2≥B2，那麼該列數據為C2+2，否則返回錯誤值 #N/A。其他同上。

4、設置好輔助列，就要添加數據了。右鍵單擊柱狀圖中任意一個數據，選擇“選擇數據”，點擊左側“添加”。系列名稱選擇Y軸1，系列值選擇Y軸1的列，即E2到E5的數據范圍。

5、此時注意柱狀圖中右側兩組數據已經出現了Y軸1，我們要把這個新增數據柱狀圖改成散點圖。對著任意一個數據圖右鍵單擊選擇“更改系列圖表類型”，然後重點來了，不要直接切換到“XY（散點圖）”選擇，而是在“組合中”點選Y軸1後面的下拉菜單，選擇“XY（散點圖）”，這樣才能保證其他數據依然是柱狀圖，而輔助數據是散點圖。

6、這時候新增的數據柱狀圖已經變成了小圓點，右鍵單擊小圓點選中“選擇數據”。在選擇數據源中單擊Y軸1然後選擇“編輯”，在彈出的“編輯數據系列”中，點選X軸系列值，圈選X軸列的內容。

7、此時，重復剛才添加Y軸1的動作添加Y軸2數據，X軸也照此操作，4組數據此時應該都已有輔助列的散點圖了。

8、如何才能把目前散點圖的小圓點形改成箭頭呢？切換Excel選項卡到插入，單擊“形狀”選擇“等腰三角形”並復制出第二個，其中一個設置為紅色（推薦純色、無線條），第二個設置為綠色。調整好大小後，垂直翻轉90度綠色箭頭。接下來Ctrl+C復制紅色三角形，點選黃色小圓點（漲幅部分）並Ctrl+V粘貼，黃色小圓點就變成了紅色箭頭。同理，復制綠色倒三角形，點選灰色小圓點（跌幅部分）並粘貼。

9、圖表此時就已經有了明顯的漲跌指示，當然你還可以根據需求調整顏色等進一步美化圖表。如可以將數據添加到柱狀圖內，右鍵單擊任意數據柱狀圖選擇“設置數據標簽格式”，然後選擇“軸內側”，數據就會在柱狀圖內顯示，更加整潔。同時，在小箭頭處同樣可以單擊右鍵選擇“添加數據標簽—添加數據標注”，將具體漲跌比例填寫上去，這樣柱狀圖就非常直觀了。

以上便是在Excel表格製作清晰明了數據報告的操作，學會了這些，我們便可以拋棄那些枯燥的數字報告了，同時你的領導、上司將會更喜歡看這樣的報告，因為這種報告讓人看起來更加舒服，同時也更加直觀的傳達了數字要表達的意思。希望對大家會有幫助！

⑩ 假設我在excel2003單元格中輸入數據800怎麼才能使800自動減去個180

設A列為輸入數據,在B列輸入=A1-180,然後向下復制公式即可

閱讀全文

與怎麼可以讓數據簡化相關的資料

熱點內容

為什麼安裝程序已在運行中發布：2025-02-14 01:23:45 瀏覽：163

大數據二維碼是什麼發布：2025-02-14 01:23:41 瀏覽：565

手機拍照有哪些技術發布：2025-02-14 01:22:07 瀏覽：880

山西清香型酒有哪些代理品牌發布：2025-02-14 01:18:22 瀏覽：171

希捷是做什麼產品的發布：2025-02-14 01:09:51 瀏覽：496

上海做老房子交易的中介有哪些發布：2025-02-14 01:09:38 瀏覽：673

數據線車載藍牙鄭州哪裡有賣的發布：2025-02-14 00:55:02 瀏覽：214

演算法中代理模型是什麼發布：2025-02-14 00:55:01 瀏覽：717

excel數據怎麼導入外部發布：2025-02-14 00:54:11 瀏覽：436

如何入住微信小程序發布：2025-02-14 00:47:27 瀏覽：976

哪個微信小程序可以看戶型圖發布：2025-02-14 00:47:19 瀏覽：587

奶粉dha含量看哪個數據發布：2025-02-14 00:26:40 瀏覽：335

練吃雞技術在哪裡練發布：2025-02-14 00:20:19 瀏覽：325

存在的科學技術問題是什麼意思發布：2025-02-14 00:14:32 瀏覽：414

怎麼測量產品孔的角度發布：2025-02-14 00:09:47 瀏覽：643

昆明的菜市場為什麼都關了發布：2025-02-14 00:08:04 瀏覽：198

白天菜市場有什麼好吃的發布：2025-02-14 00:07:21 瀏覽：38

什麼是攝影信息特性發布：2025-02-13 23:57:03 瀏覽：428

遠洋市場帝王蟹多少錢發布：2025-02-13 23:52:35 瀏覽：468

督促程序的范圍是什麼發布：2025-02-13 23:41:17 瀏覽：699