① 大數據時代,誰來保護我們的隱私
「小鳥雲」是深圳前海小鳥雲計算有限公司旗下雲計算品牌,國內領先的企業級雲計算服務商。團隊擁有多年行業經驗,專注雲計算技術研發,面向廣大開發者、政企用戶、金融機構等,提供基於智能雲伺服器的全方位雲計算解決方案,為用戶提供可信賴的企業級公有雲服務。
每年頻發的數據泄露事件總會帶來一些教訓,其中一條就是,無論何時開始採取數據保護措施永遠不會太晚。幸運的是,企業表現出更加關注數據隱私方面的工作,而大數據是他們最關心的領域之一。
就在昨日,五名微軟公司的前任員工在接受路透社的采訪時表示,微軟的漏洞報告數據在2013年時曾遭到過一次非法入侵,但這一事件在當時並沒有被曝光出來。
微軟的前雇員表示,微軟公司用了一個多月的時間修復了被入侵資料庫中羅列的所有安全漏洞,因此泄露出去的漏洞信息並不會對Windows產品的用戶造成多大的影響。微軟公司當時還曾聘請過第三方公司來對此次事件進行調查,以了解網路上是否有攻擊者利用泄露的漏洞信息來發動攻擊,但該公司並沒有發現任何與相關漏洞有聯系的攻擊事件。
Mary Shacklett是Transworld Data公司的總裁,該公司是一家技術研究和市場開發公司。作為業內人士,她給企業管理層提出一些建議,來確保他們的大數據採用可靠的數據隱私實踐。
實現匿名化的一種方法是對個人識別的數據元素進行加密。另一種方法是通過識別具有類似價值的個人的數據,然後將其平均化為一個綜合收益值,融入更大的數據分析中。其他方法還包括數據修訂或屏蔽。
收集由政府、企業和個人產生的數字化信息,為以知識和信息為基礎的決策創造了巨大的機會。在互惠互利的帶動下,有需求的各方之間可進行數據交流和發布。然而,在其原來形式的數據中通常包含敏感的個人信息,公布這些數據會侵犯個人隱私。集合型數據發布下的隱私保護是一個重要並富有挑戰的難題。大多數現有的技術使用泛化和整體性刪除方法,而我們提出了一種部分(局部)刪除方法對集合型數據進行匿名化。該方法保證無論攻擊者擁有多少數目的先驗知識,匿名化後數據中不再出現關於敏感信息的強關聯規則。該方法不僅大幅降低了信息損失,同時可根據下游使用場景要求,提供傾向保持原始數據分布或保護可挖掘的有用的關聯規則的選擇。初步評估顯示,我們的方法相比於經典的方法:在保持原始數據分布上優於其它方法100倍以上,保留了更多數目的可挖掘有用的關聯規則並只引入了少數虛假的規則,同時信息的損失平均減少了30%左右。
以上只是數據隱私方面工作的一部分,關於數據隱私保護還有更多的方式可循,例如確定公司內部大數據所涉及到的部門,並定期審查這些部門的數據隱私。最後,在制定和實施數據隱私保護措施時,需要以企業的業務需求和發展為基礎。
② 大數據挖掘中的三種角色
大數據挖掘中的三種角色_數據分析師考試
我對數據挖掘和機器學習是新手,從去年7月份在Amazon才開始接觸,而且還是因為工作需要被動接觸的,以前都沒有接觸過,做的是需求預測機器學習相關的。後來,到了淘寶後,自己憑興趣主動地做了幾個月的和用戶地址相關數據挖掘上的工作,有一些淺薄的心得。不管怎麼樣,歡迎指教和討論。
另外,註明一下,這篇文章的標題模仿了一個美劇《權力的游戲:冰與火之歌》。在數據的世界裡,我們看到了很多很牛,很強大也很有趣的案例。但是,數據就像一個王座一樣,像征著一種權力和征服,但登上去的路途一樣令人膽顫。
數據挖掘中的三種角色
在Amazon里從事機器學習的工作時,我注意到了Amazon玩數據的三種角色。
Data Analyzer:數據分析員。這類人的人主要是分析數據的,從數據中找到一些規則,並且為了數據模型的找不同場景的Training Data。另外,這些人也是把一些臟數據洗干凈的的人。
Research Scientist:研究科學家。這種角色主要是根據不同的需求來建立數據模型的。他們把自己戲稱為不近人間煙火的奇異性物種,就像《生活大爆炸》里的那個Sheldon一樣。這些人基本上玩的是數據上的科學
Software Developer:軟體開發工程師。主要是把Scientist建立的數據模型給實現出來,交給Data Analyzer去玩。這些人通常更懂的各種機器學習的演算法。
我相信其它公司的做數據挖掘或是機器學習的也就這三種工作,或者說這三種人,對於我來說,
最有技術含量的是Scientist,因為數據建模和抽取最有意義的向量,以及選取不同的方法都是這類人來決定的。這類人,我覺得在國內是找不到的。
最苦逼,也最累,但也最重要的是Data Analyzer,他們的活也是這三個角色中最最最重要的(注意:我用了三個最)。因為,無論你的模型你的演算法再怎麼牛,在一堆爛數據上也只能幹出一堆垃圾的活來。正所謂:Garbage In, Garbage Out!但是這個活是最臟最累的活,也是讓人最容易退縮的活。
最沒技術含量的是Software Developer。現在國內很多玩數據的都以為演算法最重要,並且,很多技術人員都在研究機器學習的演算法。錯了,最重要的是上面兩個人,一個是苦逼地洗數據的Data Analyzer,另一個是真正懂得數據建模的Scientist!而像什麼K-Means,K Nearest Neighbor,或是別的什麼貝葉斯、回歸、決策樹、隨機森林等這些玩法,都很成熟了,而且又不是人工智慧,說白了,這些演算法在機器學習和數據挖掘中,似乎就像Quick Sort之類的演算法在軟體設計中基本沒什麼技術含量。當然,我不是說演算法不重要,我只想說這些演算法在整個數據處理中是最不重要的。
數據的質量
目前所流行的Buzz Word——大數據是相當誤導人的。在我眼中,數據不分大小,只分好壞。
在處理數據的過程中,我第一個感受最大的就是數據質量。下面我分幾個案例來說明:
案例一:數據的標准
在Amazon里,所有的商品都有一個唯一的ID,叫ASIN——Amazon Single Identify Number,這個ID是用來標識商品的唯一性的(來自於條形碼)。也就是說,無論是你把商品描述成什麼樣,只要ASIN一樣,這就是完完全全一模一樣的商品。
這樣,就不像淘寶一樣,當你搜索一個iPhone,你會出現一堆各種各樣的iPhone,有的叫「超值iPhone」,有的叫「蘋果iPhone」,有的叫「智能手機iPhone」,有的叫「iPhone白色/黑色」……,這些同一個商品不同的描述是商家為了吸引用戶。但是帶來的問題有兩點:
1)用戶體驗不好。以商品為中心的業務模型,對於消費者來說,體驗明顯好於以商家為中心的業務模型。
2)只要你不能正確讀懂(識別)數據,你後面的什麼演算法,什麼模型統統沒用。
所以,只要你玩數據,你就會發現,如果數據的標准沒有建立起來,干什麼都沒用。數據標準是數據質量的第一道關卡,沒這個玩意,你就什麼也別玩了。所謂數據的標准,為數據做唯一標識只是其中最最基礎的一步,數據的標准還單單只是這個,更重要的是把數據的標准抽象成數學向量,沒有數學向量,後面也無法挖掘。
所以,你會看到,洗數據的大量的工作就是在把雜亂無章的數據歸並聚合,這就是在建立數據標准。這裡面絕對少不了人肉的工作。無非就是:
聰明的人在數據產生之前就定義好標准,並在數據產生之時就在干數據清洗的工作。
一般的人是在數據產生並大量堆積之後,才來干這個事。
另外,說一下Amazon的ASIN,這個事從十多年前就開始了,我在Amazon的內網里看到的資料並沒有說為什麼搞了個這樣一個ID,我倒覺得這並不是因為Amazon因為玩數據發現必需建議個商品ID,也許因為Amazon的業務模型就是設計成以「商品為中心」的。今天,這個ASIN依然有很多很多的問題,ASIN一樣不能完全保證商品就是一樣的,ASIN不一樣也不代表商品不一樣,不過90%以上的商品是保證的。Amazon有專門的團隊Category Team,裡面有很多業務人員天天都在拚命地在對ASIN的數據進行更正。
案例二:數據的准確
用戶地址是我從事過數據分析的另一個事情。我還記得當時看到那數以億計的用戶地址的數據的那種興奮。但是隨後我就興奮不起來了。因為地址是用戶自己填寫的,這裡面有很多的坑,都不是很容易做的。
第一個是假/錯地址,因為有的商家作弊或是用戶做測試。所以地址是錯的,
比如,直接就輸入「該地址不存在」,「13243234asdfasdi」之類的。這類的地址是可以被我的程序識別出來的。
還有很難被我的程序所識別出來的。比如:「宇宙路地球小區」之類的。但這類地址可以被人識別出來。
還有連人都識別不出來的,比如:「北京市東四環中路23號南航大廈5樓540室」,這個地址根本不存在。
第二個是真地址,但是因為用戶寫的不標准,所以很難處理,比如:
縮寫:「建國門外大街」和「建外大街」,「中國工商銀行」和「工行」……
錯別字:「潮陽門」,「通慧河」……
顛倒:「東四環中路朝陽公園」和「朝陽公園(靠東四環)」……
別名:有的人寫的是開發商的小區名「東恆國際」,有的則是寫行政的地名「八里庄東里」……
這樣的例子多得不能再多了。可見數據如果不準確,會增加你處理的難度。有個比喻非常好,玩數據的就像是在挖金礦一樣,如果含金量高,那麼,挖掘的難度就小,也就容易出效果,如果含金量低,那麼挖掘的難度就大,效果就差。
上面,我給了兩個案例,旨在說明——
1)數據沒有大小之分,只有含金量大的數據和垃圾量大的數據之分。
2)數據清洗是一件多麼重要的工作,這也是一件人肉工作量很大的工作。
所以,這個工作最好是在數據產生的時候就一點一滴的完成。
有一個觀點:如果數據准確度在60%的時候,你干出來的事,一定會被用戶罵!如果數據准確度在80%左右,那麼用戶會說,還不錯!只有數據准確度到了90%的時候,用戶才會覺得真牛B。但是從數據准確度從80%到90%要付出的成本要比60%到80%的付出大得多得多。大多數據的數據挖掘團隊都會止步於70%這個地方。因為,再往後,這就是一件相當累的活。
數據的業務場景
我不知道有多少數據挖掘團隊真正意識到了業務場景和數據挖掘的重要關系?我們需要知道,根本不可能做出能夠滿足所有業務的數據挖掘和分析模型。
推薦音樂視頻,和電子商務中的推薦商品的場景完全不一樣。電商中,只要你買了一個東西沒有退貨,那麼,有很大的概率我可以相信你是喜歡這個東西的,然後,對於音樂和視頻,你完全不能通過用戶聽了這首歌或是看了這個視頻就武斷地覺得用戶是喜歡這首歌和這個視頻的,所以,我們可以看到,推薦演算法在不同的業務場景下的實現難度也完全不一樣。
說到推薦演算法,你是不是和我一樣,有時候會對推薦有一種感覺——推薦就是一種按不同維度的排序的演算法。我個人以為,就提一下推薦這個東西在某些業務場景下是比較Tricky的,比如,推薦有兩種(不是按用戶關系和按物品關系這兩種),
一種是共性化推薦,結果就是推薦了流行的東西,這也許是好的,但這也許會是用戶已知的東西,比如,到了北京,我想找個飯館,你總是給我推薦烤鴨,我想去個地方,你總是給我推薦天安門故宮天壇(因為大多數人來北京就是吃烤鴨,就是去天安門的),這些我不都知道了嘛,還要你來推薦?另外,共性化的東西通常是可以被水軍刷的。
另一種是一種是個性化推薦,這個需要分析用戶的個體喜好,好的就是總是給我我喜歡的,不好的就是也許我的口味會隨我的年齡和環境所改變,而且,總是推薦符合用戶口味的,不能幫用戶發掘新鮮點。比如,我喜歡吃辣的,你總是給我推薦川菜和湘菜,時間長了我也會覺得煩的。
推薦有時並不是民主投票,而是專業用戶或資深玩家的建議;推薦有時並不是推薦流行的,而是推薦新鮮而我不知道的。你可以看到,不同的業務場景,不同的產品形態下的玩法可能完全不一樣,
另外,就算是對於同一個電子商務來說,書、手機和服裝的業務形態完全不一樣。我之前在Amazon做Demand Forecasting(用戶需求預測)——通過歷史數據來預測用戶未來的需求。
對於書、手機、家電這些東西,在Amazon里叫Hard Line的產品,你可以認為是「標品」(但也不一定),預測是比較準的,甚至可以預測到相關的產品屬性的需求。
但是地於服裝這樣的叫Soft Line的產品,Amazon幹了十多年都沒有辦法預測得很好,因為這類東西受到的干擾因素太多了,比如:用戶的對顏色款式的喜好,穿上去合不合身,愛人朋友喜不喜歡……這類的東西太容易變了,買得人多了反而會賣不好,所以根本沒法預測好,更別Stock/Vender Manager提出來的「預測某品牌的某種顏色的衣服或鞋子」。
對於需求的預測,我發現,長期在這個行業中打拚的人的預測是最準的,什麼機器學習都是浮雲。機器學習只有在你要面對的是成千上萬種不同商品和品類的時候才會有意義。
數據挖掘不是人工智慧,而且差得還太遠。不要覺得數據挖掘什麼事都能幹,找到一個合適的業務場景和產品形態,比什麼都重要。
數據的分析結果
我看到很多的玩大數據的,基本上乾的是數據統計的事,從多個不同的維度來統計數據的表現。最簡單最常見的統計就是像網站統計這樣的事。比如:PV是多少,UV是多少,來路是哪裡,瀏覽器、操作系統、地理、搜索引擎的分布,等等,等等。
嘮叨一句,千萬不要以為,你一天有十幾個T的日誌就是數據了,也不要以為你會用Hadoop/MapRece分析一下日誌,這就是數據挖掘了,說得難聽一點,你在做的只不過是一個統計的工作。那幾個T的Raw Data,基本上來說沒什麼意義,只能叫日誌,連數據都算不上,只有你統計出來的這些數據才是有點意義的,才能叫數據。
當一個用戶在面對著自己網店的數據的時候,比如:每千人有5個人下單,有65%的訪客是男的,18-24歲的人群有30%,等等。甚至你給出了,你打敗了40%同類型商家的這樣的數據。作為一個商戶,面對這些數據時,大多數人的表現是完全不知道自己能幹什麼?是把網站改得更男性一點,還是讓年輕人更喜歡一點?完全不知道所措。
只要你去看一看,你會發現,好些好些的數據分析出來的結果,看上去似乎不錯,但是其實完全不知道下一步該干什麼?
所以,我覺得,數據分析的結果並不僅僅只是把數據呈現出來,而更應該關注的是通過這些數據後面可以干什麼?如果看了數據分析的結果後並不知道可以干什麼,那麼這個數據分析是失敗的。
總結
綜上所述,下面是我覺得數據挖掘或機器學習最重要的東西:
1)數據的質量。分為數據的標准和數據的准確。數據中的雜音要盡量地排除掉。為了數據的質量,大量人肉的工作少不了。
2)數據的業務場景。我們不可能做所有場景下的來,所以,業務場景和產品形態很重要,我個人感覺業務場景越窄越好。
3)數據的分析結果,要讓人能看得懂,知道接下來要干什麼,而不是為了數據而數據。
搞數據挖掘的人很多,但成功的案例卻不多(相比起大量的嘗試來說),就目前而言,我似乎覺得目前的數據挖掘的技術是一種過渡技術,還在摸索階段。另外,好些數據挖掘的團隊搞得業務不業務,技術不技術的,為其中的技術人員感到惋惜……
不好意思,我只給出了問題,沒有建議,這也說明數據分析中有很多的機會……
最後,還要提的一個是「數據中的個人隱私問題」,這似乎就像那些有悖倫理的黑魔法一樣,你要成功就得把自己變得黑暗。是的,數據就像一個王座一樣,像征著一種權力和征服,但登上去的路途一樣令人膽顫。
以上是小編為大家分享的關於大數據挖掘中的三種角色的相關內容,更多信息可以關注環球青藤分享更多干貨
③ 刑事案件中個人隱私包括什麼
法律分析:個人隱私是指個人生理、心理以及社會交往過程中的秘密,包括公民的性生活,公民的檔案材料,純屬個人的情況等。根據相關法律規定,刑事案件中,涉及國家秘密、商業秘密、個人隱私的案件,開庭審判不予公開。刑事訴訟中適用個人隱私條款進行不公開審判,應以主要犯罪事實中存在合法的個人隱私為前提,主要犯罪事實中涉及的個人信息才可能成為刑法所要保護的個人隱私。
法律依據:《中華人民共和國刑事訴訟法》
第五十四條 人民法院、人民檢察院和公安機關有權向有關單位和個人收集、調取證據。有關單位和個人應當如實提供證據。行政機關在行政執法和查辦案件過程中收集的物證、書證、視聽資料、電子數據等證據材料,在刑事訴訟中可以作為證據使用。對涉及國家秘密、商業秘密、個人隱私的證據,應當保密。凡是偽造證據、隱匿證據或者毀滅證據的,無論屬於何方,必須受法律追究。
第一百八十八條 人民法院審判第一審案件應當公開進行。但是有關國家秘密或者個人隱私的案件,不公開審理;涉及商業秘密的案件,當事人申請不公開審理的,可以不公開審理。不公開審理的案件,應當當庭宣布不公開審理的理由。
④ 什麼是隱私它具體包括哪些內容
隱私是一種與公共利益、群體利益無關,當事人不願他人知道或他人不便知道的個人信息,(只能公開於有保密義務的人)當事人不願他人干涉或他人不便干涉的個人私事,以及當事人不願他人侵入或他人不便侵入的個人領域。隱私是個人的自然權利。從人類抓起樹葉遮羞之時起,隱私就產生了。
隱私包括的內容:
隱私的內容即客觀方面是指特定個人對其事務、信息或領域秘而不宣、不願他人探知或干涉的事實或行為。隱私的內容是隱私主體的主觀意志作用於客體及客觀世界,即主客觀因素相統一的過程和結果,也就是隱私中「隱」的表現。
(4)通過數據分析個人隱私叫什麼擴展閱讀:
1995年10月美國商務部電訊與信息管理局發布的關於隱私與信息高速公路建設的白皮書中認為隱私權至少包括以下九個方面:
1、關於私有財產的隱私;
2、關於姓名與形象利益的隱私;
3、關於自己之事不為他人干涉之隱私;
4、關於一個組織或事業內部事務的隱私;
5、關於某些場合不便露面的隱私;
6、關於尊重他人不透露其個人信息之隱私;
7、關於性生活及其他私生活之隱私;
8、關於不被他人監之要求的隱私;
9、私人相對於官員的隱私。由此可見,在現行美國法律體系中,隱私已涵蓋了個人及個人生活的幾乎所有環節,已成為現代社會保護個人利益之最全面、最有力的「借口」和「手段」。
⑤ 大數據時代的用戶數據如何區別保護
大數據時代的用戶數據如何區別保護
大數據時代,是物聯網的時代,隨著雲存儲和雲計算的發展,以智能手機、智能家電、可穿戴設備為代表的智能終端的普及,通過各種智能終端上傳和收集的用戶數據將越來越多,對用戶數據的分析和挖掘及利用,將是大數據的商業價值所在,蘊藏和巨大價值的用戶數據的性質及使用規則是我們值得思考的問題。
用戶數據的「區分所有權」構想
提到用戶數據,我們首先想到的是用戶的「隱私權」。民法大家王利明教授在其主編的《人格權法新論》一書中提到:隱私權是自然人享有的對其個人的與公共利益無關的個人信息、私人活動和私有領域進行支配的一種人格權。可見隱私權是一項「個體」權益,強調權利的身份和人格的屬性。
用戶數據的商業價值核心並不是「個人」的人格權益,其必要條件是具備足夠多的用戶個體樣本,其更強調「集合」的權利,單個用戶數據的商業價值是有限的。而用戶數據的核心價值在於通過對雲端存儲的海量的用戶個人狀況、行為、需求的樣本分析和挖掘,一方面為上游硬體商提供產品的開發依據,另一方面對用戶的消費、生活提供「量身打造」的服務,從而形成物聯網的全產業鏈循環,實現更高效的管理社會資源並創造更多的價值。
可見,雖然用戶數據來源於「個體」數據,但最終使社會獲益的是用戶的「集合」數據。因此,在界定用戶數據的性質方面,筆者建議根據單個數據是否具有身份屬性,將用戶數據分為身份數據和樣本數據,並對這兩類數據加以區別保護。
用戶的身份數據是指可以通過單一的個體數據,即能鎖定特定用戶的數據。如姓名、身份證號、各種賬號信息、聯系方式等。比如我們通過一個電話,就能聯繫到一個特定的用戶。因此,此類信息具有較強的身份屬性,須定義為「隱私權」的范圍,其權利主體應為用戶個人所有,其使用和經營,須經過用戶的許可,否則將被判定為侵權。現行法律法規如《全國人民代表大會常務委員會關於加強網路信息保護的決定》、工信部出台的《電信和互聯網用戶個人信息保護規定》以及消費者權益保護法、《網路交易管理辦法》中規定的個人信息,當屬於用戶的身份數據范疇。
樣本數據是指通過個體數據匯聚成的用戶個人狀況、行為、需求的資料庫以及通過分析和挖掘以上數據獲得的相關數據。此類數據的所有權應為用戶和數據收集方共有,但經營使用權建議應掌握在能夠發揮其價值的數據收集者手中。將所有權和經營權區分開來,既能從法律上保證用戶的個體權益,又符合經濟學的原理。
樣本數據的經營規則
用戶身份數據的使用規則可以依據現有的法律法規執行。我們僅需要通過立法明確以上法律所適用的數據的范圍,並在執行層面的政策上制定可操作的保護用戶身份數據和隱私權的規章制度。
對於樣本數據的使用和經營規則,現有法律並沒有明確依據。根據上文的闡述,筆者已將其所有權擬定為用戶和數據收集者共有,經營使用權則建議應掌握在能夠發揮其價值的數據收集者手中。這樣設計的目的在於,一是保留用戶的「被遺忘權」;二是發揮物盡其用的作用。
首先,保留用戶的「被遺忘權」是用戶數據使用的基礎。
大數據時代到來,人們最擔心的是自己將被暴露得一覽無余,沒有隱私可言。因此,個體信息是否公開,公開的程度,需要個體能夠掌控,即用戶自主決定其向外界公開的個人信息的廣度和深度,也可隨時自行或要求收集數據方,刪除其掌握的任何關於用戶個體的數據。用戶要求收集者刪除其樣本信息時,須提供可以辨識其個體信息的依據(一般須為身份信息),以證明其要求刪除的信息是屬於自己的樣本信息。
其次,數據收集者在收集樣本數據時,須向用戶群體公示其收集途徑和方式,以及用戶刪除自己樣本信息的途徑和方法。只有這樣,用戶才能知曉其被收集者收集的數據是什麼,以及自己的樣本信息被經營者使用的狀況是否安全,從而判斷其是否願意繼續使用數據收集者的產品,並將自己的樣本信息交給數據收集者經營。一旦用戶選擇使用某一數據收集者的產品,數據收集者將與用戶共有其收集的用戶樣本數據。
第三,數據收集者在遵守法律對用戶隱私保護前提下,無需用戶授權,可自由地使用和經營其收集到的用戶的樣本數據,直至用戶自行或要求其刪除樣本數據。
當前,各數據收集者之間進行不同程度的共享和授權數據的需求已是大數據的發展趨勢。雲與雲的互聯互通才能使數據樣本變得足夠龐大,使數據分析和挖掘的結果更有價值,使用戶不同智能終端之間的連接變得可能,從而真正的實現大數據的物聯網。
樣本數據的共享和授權中涉及到大量個體信息,如果用戶此類活動需要經過個體用戶的授權,將會極大地阻礙商業效率,其數據和信息的收集是隨時隨地的,要求單個用戶對單個的樣本授權,也會影響用戶的體驗。因此最現實的方式是數據的收集者在經營和使用其收集的數據時,無需個體用戶的單獨授權。
最後,數據收集者通過樣本數據所獲取的收益,個體用戶須有分配權。
個體用戶對數據經營的收益分配權容易理解。數據的源頭是個體,個體是樣本數據的所有者,因此其理所應當得到經營數據的利益。分配的方式和數量可由數據收集者確定並公示,一旦用戶使用特定數據收集者的產品,即表明其同意以此對價獲取收益。當然,用戶領取收益的前提是提供可以辨識其個體信息的依據(一般須為身份信息),以證明其是對應個體樣本數據的提供者。
⑥ 個人隱私是什麼意思什麼叫做隱私
法律分析:個人隱私是指公民個人生活中不願為他人(一定范圍以外的人)公開或知悉的秘密。隱私權是自然人享有的對其個人的、與公共利益無關的個人信息、私人活動和私有領域進行支配的一種人格權。不願讓他人知道自己的個人生活的秘密,我國公民依法享有不願公開或不願讓他人(一定范圍之外的人)知悉的不危害社會的個人秘密的權利。
法律依據:《中華人民共和國治安管理處罰法》 第四十二條 有下列行為之一的,處五日以下拘留或者五百元以下罰款;情節較重的,處五日以上十日以下拘留,可以並處五百元以下罰款:(一)寫恐嚇信或者以其他方法威脅他人人身安全的;(二)公然侮辱他人或者捏造事實誹謗他人的;(三)捏造事實誣告陷害他人,企圖使他人受到刑事追究或者受到治安管理處罰的;(四)對證人及其近親屬進行威脅、侮辱、毆打或者打擊報復的;(五)多次發送淫穢、侮辱、恐嚇或者其他信息,干擾他人正常生活的;(六)偷窺、偷拍、竊聽、散布他人隱私的。
⑦ 個人隱私數據包括什麼
法律分析:個人隱私包括個人生活安寧權,個人生活情報保密權,個人通訊保密權。未經公民許可,公開其姓名、肖像、住址和電話號碼,非法侵入、搜查他人住宅,或以其他方式破壞他人居住安寧,泄露公民的個人材料或公諸於眾或擴大公開范圍等都屬於侵犯隱私權的表現。
法律依據:《中華人民共和國憲法》第三十九條 中華人民共和國公民的住宅不受侵犯。禁止非法搜查或者非法侵入公民的住宅。
《中華人民共和國憲法》第四十條 中華人民共和國公民的通信自由和通信秘密受法律的保護。除因國家安全或者追查刑事犯罪的需要,由公安機關或者檢察機關依照法律規定的程序對通信進行檢查外,任何組織或者個人不得以任何理由侵犯公民的通信自由和通信秘密。
⑧ 大數據與個人信息保護
大數據與個人信息保護
數據為王的時代,對於用戶隱私的保護必然會越來越受到重視。那麼,個人隱私保護制度會對互聯網的發展帶來怎樣的影響?如何才能在大數據應用的商業利益與公眾的個人信息保護需求之間取得平衡?在互聯網無時不在、無時不有的今天,我們的隱私在各種情況下被收集、被利用,甚至被濫用,有關個人信息保護的立法也是國家立法計劃中的重要內容,我主要跟大家分享幾個方面,首先什麼是隱私,如果這一點達不成共識,討論就沒有意義了。第二,我們現在所謂隱私保護面臨哪些問題?第三,面對這些問題,未來從法律上怎麼解決這些問題?
隱私是一個法律概念
隱私簡單地說,是一個人不想讓別人知道的東西。但個人的生活、感情因人而異,大家對隱私的看法也不一樣。很多朋友都講,隱私體現的是一種個人的東西,這在我理解的話就是屬於個人信息的范疇。很多人對什麼是隱私有分歧,就同一個人來說也不確定自己哪些是隱私,或者有些時候是,有些時候不是,完全自己說了算。所以這樣的社會里如果較起真來,或者在法律上要維權的話就混亂了。
隱私不是中國本土的概念,隱私是用美國隱私概念的瓶裝入了歐洲隱私的酒拿到中國來的。歐美人並沒有對隱私從不同的學科、不同的語境、不同的地域文化上做區分,在歐美問什麼是隱私,分歧也很大,但可能會比中國好一些,因為這種隱私跟我們的文化水土不服。隱私是一個與地域文化傳統關聯十分密切的概念。
在歐洲,宗教信仰就是隱私,而在中國,誰會認為這是隱私呢?中國傳統上並沒有隱私的概念,有一個觀念是陰私。但上世紀70年代末80年代初,從歐美翻譯過來的隱私的概念傳到中國後廣泛傳播,導致了現在中國的隱私泛濫、泛化,動不動就說侵犯隱私,但你問什麼是隱私,他卻無法給你准確的答案。
隱私應當做不同學科、不同語境、不同地域文化的理解。女性的三圍、身高、體重是心理學或社會學上的隱私,一定不能將這些隱私,包括政治學、經濟學意義上的隱私跟法律上的隱私混為一談。法律上,隱私是通過隱私權來保護的,權利就是行為自由的邊界。這個邊界很清晰,其他人不能進入,否則就可以起訴他侵權。如果法律上的隱私內涵不確定、外延不明確,因人而異,就會出現混亂。
隱私與公共利益無關
隱私絕對是個人的東西,比如國家機關就沒有隱私。法律上的隱私,是個人信息的一部分,但不是所有個人信息都是法律上的隱私,姓名、家庭住址、女性的三圍絕對不是法律上所講的隱私。中國的陰私概念是值得借鑒的,從1956年「民法草案」開始,到1982年的民法通則,這一段時間里中國的法律上就有陰私概念。陰私是指不好的事情,一般正常理性的人,這些事情、信息公布出去會讓他名譽掃地,讓他的社會尊嚴受到傷害。傳統的陰私僅僅是指與性有關的一些東西,比如裸照、性生活、兩性情感。這個價值取向值得我們認可,但缺點是內涵比較窄,僅限於與性有關的方面。
陰私的價值觀我們要繼承。在上世紀70年代、80年代之前,陰私內涵比較窄沒有問題,但是發展到今天,價值取向擴大了。很多人認可隱私這個詞,這就是中國傳統陰私的概念,但是內容要擴展。所以法律上的隱私,不限於與性有關的,還包括不為人知的重大生理疾病缺陷,這些缺陷公布出去同樣會讓他受到歧視,或令他的名譽受到影響。
這里下一個定義,法律上的隱私是指與公共利益、社會利益沒有直接關系,同時又與人的名譽和尊嚴有關的極少數個人信息,這是抽象出來的本質;包括但不限於裸照、性相關、情感經歷、生理疾病等,這是范圍和表象。很多學者批評中國民法通則沒有規范隱私,不重視人權,但是最高法院的司法解釋是把它作為名譽權來保護的,比如披露與性有關的東西,讓人名譽掃地,就認為侵犯了名譽權。其實按我的理解,隱私權不獨立,隱私與名譽是相聯系的。這方面中國其實比歐美先進,中國有陰私概念,披露陰私即會使人名譽掃地。
與公共利益、社會利益的關系還要看具體情況。一般人的婚外情或者是兩性的東西可能被認為是屬於隱私,但是作為政治官員、作為公眾人物,他們的某些個人信息可能與公共利益、社會利益有關系,所以這部分在一定范圍內可以公開。一般人認為屬於隱私的,他們要受到限制。但是無論如何,在披露這些政治人物或者公眾人物隱私時也要考慮到他們作為一個人最起碼的名譽和尊嚴,披露的方式要注意,比如將裸照放在網上是不可以接受的,不能因為是公眾人物就不被保護。再比如犯罪記錄,它有不同國家、不同文化的考量。有的以社會利益為本位的國家不把犯罪記錄作為隱私,他們認為如果把犯罪記錄作為隱私保護起來的話,會對周圍人的安全帶來隱患,雖然公開犯罪記錄也可能會使被公開者的尊嚴受損。
難以操作的個人信息保護指令
我們現在說的個人信息、敏感信息的概念來自歐盟。歐盟與中國國情不同,拿過來沒有可操作性。今天在討論隱私遇到互聯網時,一定要知道這個隱私是什麼樣的隱私,否則討論就沒有任何意義。歐美的隱私觀,表面上看好像尊重了個人權利,好像很現代化,實際上不僅沒有任何積極意義,還會帶來很多消極的作用。現在所說的「隱私遇上互聯網」的這個隱私,不是我講的法律上的隱私,而是受到歐美隱私觀影響的一種東西。
在個人信息中,姓名、家庭地址、電話號碼都是在社會交往中正常產生的,我們反對的是騷擾電話、垃圾簡訊這樣的濫用行為。現在買賣個人信息很常見,發送垃圾簡訊、騷擾電話,有人認為是侵犯隱私,這看起來非常誘人的想法實際上正是導致問題泛濫的根源。按照刑法修正案,情節嚴重的買賣個人信息是一種犯罪行為,但是起訴維權的成本特別高,侵權和犯罪的成本卻特別低。現在的隱私觀念聽起來講人權,但客觀上不利於受害人維權。
我們現在的立法是學習歐盟的,全國人大常委會2012年通過一個規定,互聯網公司在收集個人信息的時候應當徵得當事人的同意,當事人有決定權是否讓你收集;有知情權,你基於什麼樣的目的收集個人信息,收集以後存在什麼地方;當事人也有查看的權利、刪除的權利、修改的權利,比如信息記錄不完整、有出入時可以進行修改;甚至還有被遺忘的權利———以前互聯網上的信息,時過境遷不希望放在網上的時候有權請求刪除,刪除之後在互聯網上就被遺忘了,所以是被遺忘的權利。
收集信息所涉及的同意、知情、查詢、修改、刪除權是歐盟1995年的個人信息保護指令中所規定的內容,去年修改時增加了被遺忘的權利,但是這個權利的落實需要技術上的一個先決條件,就是當事人必須知道自己的信息何時何地被何人收集在了什麼地方,這樣才能行使相關權利。歐盟的個人信息保護指令源於上世紀60年代末70年代初,那時只有銀行、保險、電信公司和政府機構才有大型計算機,但現在,移動互聯網的出現讓信息的收集無時無處不在,每個人的工作單位、電話號碼、家庭地址能說清楚何時何地被何人收集了嗎?所以現在的立法和認識都遠遠過時了,沒有辦法操作。
去年歐洲討論很激烈的是被遺忘的權利,最後勉強通過,我們馬上將歐洲的東西引進過來。歐洲有沒有大的互聯網公司?一個都沒有。歐盟像垂暮的老年,特別保守,極端推崇個人的權利、個人的自由,歐盟的隱私觀就是極端個人主義自由觀的體現。
互聯網收集的信息多數不是隱私
當隱私遇到互聯網,很多時候我們說的那個隱私其實並不是隱私。互聯網收集信息無處不在無時不有,但收集的這些信息多數不屬於隱私范疇:比如說在當當購書了,就會發現上網時會提示你買什麼書;或者使用了搜索引擎,下次再使用時就會自動彈出相關的東西,很多人都錯誤地認為這是侵犯了隱私。排除政府的行為,對互聯網企業來說,你要是認為它收集的信息侵犯了你的隱私,這十有八九是自作多情。互聯網企業無需知道你是張三還是李四,它只需要有針對性地推廣商品和服務。
在互聯網背景下,要區分什麼是我的個人信息,什麼是可以找到我的信息。個人信息是由若乾片斷組合而成的,N個片斷的組合才是我的個人信息。如果N -1個片斷的話,不是完整的我,就不是個人信息了。所以行為偏好不是個人信息,個人信息是能夠直接或間接識別出一個人的信息總和,單單行為偏好的數據不足以識別出一個完整的我。但是行為偏好數據可以讓商家很快找到這個人所需要的服務,對雙方都有好處。所以隱私遇到互聯網,有一個觀念要轉變,很多人認為商家收集信息就是侵犯個人隱私,這是錯誤的,是對互聯網的誤解。一般來說互聯網公司無需知道一個人的個人信息,也沒有動機知道,知道對它沒有任何好處,只有壞處。只有一種情況例外,就是比如公安機關依法定程序找互聯網企業要信息。
現在的大數據時代還意味著,原來散落在互聯網各個角落的信息,通過數據信息的收集、加工技術,海量數據將連在一起。這樣,原來不能識別出一個人的N -1、N - 2、N -3個信息就可以還原為N個信息,就可以找到這個人,實行實名化。所以這里有一個原則,在大數據的背景下對數據的加工分析匹配過程一定要匿名化。匿名化對商家來說,就是處理的這些數據不會知道具體是誰的信息,只是數據而已。收集加工處理越精準,才越有利於用戶和企業之間減少交易成本。當然還有一個原則,陰私是禁止收集、禁止加工的,但遵循匿名原則的話,這個問題就不存在了。
只要我們遵循以上的這些原則,隱私遇到互聯網其實沒有什麼大問題,不像傳說中那麼恐怖。最重要的,一是要規范政府的行為,二是要規范企業的信息加工,使最後的匹配行為一定匿名化。如果這兩點做到了,在互聯網環境下,我們就不要老強調信息安全,害怕泄露隱私。現在我們在觀念上本末倒置,強調信息的安全,事實上無法安全。