最近有人問我圖像處理怎麼研究,怎麼入門,怎麼應用,我竟一時語塞。 仔細想想,自己也搞了兩年圖像方面的研究,做個兩個創新專案,發過兩篇論文,也算是有點心得,於是總結總結和大家分享,希望能對大家有所説明。 在寫這篇教程之前我本想多弄點插圖,讓文章看起來花哨一點,後來我覺得沒必要這樣做,大家花時間沉下心來讀讀文字沒什麼不好,況且學術和技術本身也不是多麼花哨的東西。
一、圖像處理的應用雙效犀利士 雙效犀利士藥局 雙效犀利士香港 雙效犀利士副作用 雙效犀利士真偽
這個其實沒什麼好說的,一種技術的應用價值不是靠嘴上說,而是要看有多少人去搞,很簡單的道理。 其實我覺得判斷一項技術有沒有價值、有多大價值的最簡單最有效的方法就是看有多少人在研究它。 如果大家都在研究,那必然說明它很火,至少目前很火,以後的幾年裡依然還會火。 因此,如果你不確定圖像處理是不是有價值,那就查查全國圖像處理工程師的數量就行了。
當然這裡還是簡單提一下。 如果你真的只想問「圖像處理有什麼用? ",相信百度會給出比我更專業的答案。 不過作為圖像處理的行內人,我還是從幾個基本的點來具體說一下。
1、身份認證
21世紀是刷臉的時代,這一點無可厚非。 首先是銀行,據說重慶的銀行已經使用了人臉識別的驗證系統來進行輔助的認證。 其次是門禁系統,以前是指紋,虹膜,現在就是人臉。 指紋、虹膜的識別雖然準確,但是有侵犯性,採集的過程中有侵犯性,驗證的過程中也有侵犯性,反正讓誰天天錄指紋(採集指紋資訊),用眼睛瞪攝像頭(採集虹膜資訊),誰都會覺得不舒服的,況且手還會脫皮。 相比之下,人臉的識別就方便多了,拍張照片(採集人臉資訊)誰都不會介意。 最後是監控,一個攝像頭所拍的監控能從不同的角度記錄成百上千的人(比如車站等密集場所的監控),讓員警去辨認將是一個浩大的工程,要是系統能夠自動判別人員信息,無疑會給辦案帶來極大方便。
2、監控安防
安防監控可以說是圖像處理領域最有潛力的應用領域。 如今各個城市都在瘋狂的安裝監控攝像頭,全國時刻都有無數的攝像頭在錄監控,但是安防監控的後端處理卻沒跟上。 什麼是後端處理,簡單的說就是監控錄像的視頻處理。 注意這裡的視頻處理可就不止包含人臉識別了,還有行人檢測、異常檢測、顯著性檢測、協同跟蹤等。 人臉識別之前說了,這裏簡單說說行人異常檢測。 圖像處理中的行人異常檢測在外行人眼中是一個非常有魔力的東西。 畢竟讓攝像頭通過監控視頻就能判斷出當前畫面中誰是好人誰是壞人(當然直接分為好人和壞人還是太武斷了),在一般思維中貌似是不可能的。 但是請不要忽略這樣一個事實,就是目前大部分監控視頻的分析處理都是由人工來完成的,員警破案時經常動不動就調出最近幾天的監控視頻,然後從頭看到尾,其工程量之大可想而知。 也正是這樣才催生了人們對智能監控方面的研究,因為有這方面的實際需求。 當然我們的視頻分析程式不會直接給出諸如「好人or壞人」這樣的武斷而片面的判斷結果。 就當前的技術水準而言,能夠統計當下監控畫面中的人數(行人檢測)、定位他們的人臉(人臉檢測)、識別他們的身份(人臉識別)、判別他們的表情(表情識別)、檢測他們的動作(異常檢測),這就已經夠了。 這樣以後人們就不會再面對長達幾十甚至上百個小時的監控視頻發呆,而是直接分析計算機給出的數據,當前畫面中有多少人、都是誰、誰的動作可疑等。 總之,接下來智慧監控發展會很迅速,因為需求很迫切。
3、深度學習(Deep Learning)
通俗的說一句,「圖像處理是深度學習應用的天堂」。。 深度學習這個概念可能有人不太熟悉,大家可以自行百度,我這裡給出一個相對通俗的解釋:"如果你不知道什麼叫深度學習,就想想《終結者》中的T-800"。 當然這句話不是我說的,是出自業界的一位大牛之口。 當然這可能有點小片面,不過深度學習確實是公認的新一代人工智慧的基礎。
這裡舉兩個例子。 一是谷歌的人工大腦專案。 谷歌公司可以說是深度學習方面的牽頭企業了,其在2012年公佈的谷歌大腦項目,動用了1.6萬個計算節點,訓練數周,得到的人工智慧模型能夠自主識別貓臉圖像,為新一代人工智慧開闢了道路,之後微軟深度學習研究院、百度深度學習研究院等機構都開始大量投入,各個高校也搞得風聲水起,原因很簡單,大家都知道它會火。
第二就是圖像識別方面的競賽。 最有權威的就是ImageNet競賽。 大家在一個擁有上千萬張,上千類別的圖像資料庫上訓練和測試自己的演算法,比拼識別率。 近幾年來,摘得桂冠的一直都是深度學習模型,確切的說是卷積神經網路。 更多有關ImageNet歷年的競賽資訊大家可以自行百度。印度犀利士 印度犀利士5mg哪里买 印度犀利士ptt 印度犀利士哪里买
說道深度學習在圖像處理的應用,不得不提中國的湯曉鷗教授,說他是國內深度學習的領頭羊也不為過。 他提出的DeepID人臉識別演算法(一共分為三代),在一些大規模人臉資料庫上的正確率(若LFW庫)已經達到了99.75%,單純從數位上講的話可以說已經超越了人類的識別率,為此湯教授還開辦了公司,開發FaceSDK(雖然還沒有公佈)。 不過拿計算機和人腦相比本身就是不合理的,各有所長嘛。 不過可見DeepLearning在圖像識別領域的強大威力。 至於深度學習與圖像處理的關係這裡就不用多說了,谷歌大腦識別的是圖像,深度學習競賽用的是圖像,DeepID識別的還是圖像人臉,雖然深度學習在其他方面諸如語音辨識等也有應用,在圖像處理依然是其主要的應用領域。
二、圖像處理研究工具
圖像處理的研究分為演算法研究和應用兩個部分。 用到的主要程式設計語言有Matlab、C/C++、Python等,原因很簡單,它們都有很多相應的第三方庫,不用我們從零開始程式設計。
1、Matlab
MathWork公司的Matlab軟體可以說是演算法研究的利器,它的強大之處在於其方便快捷的矩陣運算能力和圖形模擬能力,單從簡潔性和封裝性來說,確實完爆其他語言。 但高度封裝必然會相應的損失一部分靈活性,況且Matlab嚴格的講更像是一個工具,而非一門程式設計語言。 順便提一句,它在2015年程式設計語言排行榜中位於第20名,僅次於IOS開發的Objective-C。
對於演算法研究人員(尤其是高校的碩士博士),首選工具自然是matlab,因為它簡便快捷,封裝性好,更重要的是全世界幾乎所有的演算法大牛、精英教授都會首先公佈對應的Matlab源碼,然後在逐步改寫成其他語言進行實際應用。 所以,如果你想做圖像處理方面的研究,Matlab是必須掌握的,而且是熟練掌握。 當你有一些想法需要驗證時,最好明智的先用matlab編寫出來測試。 如果你上來就用看似高大上的C++來實驗,不僅錯誤BUG一大堆,到頭來可能效果還不佳,就算效果好,時間也會耽擱不少,畢竟演算法開發還是要快的,這樣才能趕在別人之前發論文。 總之,只要是接觸圖像演算法,終究逃不過Matlab,就算你是軟體開發的,不研發演算法,但總得能看懂別人的Matlab演算法吧。
對於之前印度犀利士心得 印度犀利士香港 印度犀利士真伪 印度犀利士20mg 印度犀利士副作用
沒怎麼接觸過Matlab與圖像處理的人,在這裡推薦一本相關的書籍《MATLAB圖像處理實例詳解(附光碟)》。 這本書對於Matlab圖像處理入門還是很有説明的。 記得我當時剛上研究生時就靠兩本書入門的,一是岡薩雷斯的《數位圖像處理》,二是這本《MATLAB圖像處理實例詳解》。 不過這裡友情提示,在看這類教程(不僅僅是Matlab)時千萬不要試圖去記憶所有的工具函數,這種做法是十分愚蠢的。 正確的做法是根據自己的情況快速翻閱這類工具書,可以找出裡面的有實際意義的源碼來敲一敲練練手感,至於具體的工具函數,只需要知道Matlab提供了這方面的功能就行了,以後用到了再回來查,或者谷歌百度。 我覺得在入門階段,最重要的不是看了多少書,聽了多少課,而是儘快自己敲出一段代碼,運行出結果,來建立自信和成就感,這才是支持我們走下去的最實在的動力。 記得我當時看了沒多久就自己敲了一個蹩腳的車牌檢測的Matlab程序,現在看來真是漏洞百出,不過當時我真的很興奮,很有成就感,覺得自己能幹這行,對於初學者來說,這種感受彌足珍貴。