AI領(lǐng)域的賽博佛祖,他的名字,叫張呂敏。
相信很多大家對AI領(lǐng)域的賽博佛祖,他的名字,叫張呂敏。還不知道吧,今天菲菲就帶你們一起去了解一下~.~!
前兩天,AI繪圖圈的賽博佛祖張呂敏,又出手了,發(fā)了一個挺牛逼的新項目,叫Omost。
簡而言之,Omost的作用就是,把簡單的一句話,擴展成非常牛逼、詳細且精準的Prompt,然后挨個畫出各種不同的區(qū)域,最后合成在一起。
注意,是合成,所以精準可控能力極強。
非常牛逼的自動繪圖的Agent,從此,人人都可以不被所謂的Prompt困擾,普通人用一句話,也能生成很不錯的圖片。
有一個東西跟Omost用的是同樣的技術(shù)路線,它叫Dalle3。
但是,Dalle3畢竟是OpenAI的玩意,你只能付費氪金用,沒有開源。
但是Omost,開源。
我的小伙伴@祁玨瑜第一時間做了一個本地整合包扔給了我,在我玩了2天后,只能感嘆一句:
太強了。
比如我想畫一個飛船,我就在輸入框中直接輸入“太空中的未來飛船”,他就會開始哐哐給我寫代碼。
這些代碼可能很多朋友看不懂,我翻譯成中文的你們就知道了。
可以理解成把畫面拆成了了九份,九宮格,畫面中心是什么,畫面左上方是什么,右下方是什么,然后挨個去繪制,最后合在一起。
當把所有的代碼輸出完后,我們直接點渲染就行,一幅飛船圖就出來了~
也可以跟Dalle3一樣,再進行對話式的區(qū)域修改,比如把背景從太空換成海洋等等。
但是目前還沒法接入到SD生態(tài)里去,大模型也是封裝好的。
大語言模型用的是Llama3-8b,繪圖模型用的是RealVisXL V4.0。
本地有8G顯存就能跑起來。
整合包我扔公眾號后臺了,對著公眾號私信“O”這個英文字母就有。下載下來解壓完后,第一次先運行env.bat,然后再運行run.bat就行了。以后每次打開,就只需要運行一下run.bat。
不過Omost畢竟開源了,肯定會有無數(shù)大佬,基于Omost上進行魔改,接入到WebUI和ComfyUI也肯定指日可待。
Omeost強是強,但是讓我更感慨,覺得更強的,是Omeost的作者。
賽博佛祖,張呂敏。
可能有些小伙伴對這個人名非常陌生,但是如果我說一個他最著名的開源項目,相信只要是玩AI繪圖的,肯定都不會陌生了。
那個項目,叫ControlNET。
讓AI生圖實現(xiàn)多種手段自主可控,一舉將SD生態(tài)推向了繁榮,讓AI繪圖進入N多B端工作流,實現(xiàn)全面商業(yè)化的始作俑者。說它是SD生態(tài)最大的功臣也不為過。
這些,全都是ControlNET干的,可以說,ControlNET是AI行業(yè)精準控圖的爹。
而張呂敏,是ControlNET的爹。
而張呂敏的工作,除了ControlNET這種爆炸性的項目之外,還有面向普通人的傻瓜且小白的AI繪圖產(chǎn)品Fooocus,開源的。
后面又發(fā)了一個Fordge UI,對原生的SD WebUI推理進行加速等各方面優(yōu)化。在6G低顯存上可以提高60-75%的生成速度
還有LayerDiffusion,一個可以用AI直接生成原生的帶有透明背景的PNG圖片的插件,效果比生產(chǎn)完再用PS啥的摳圖的效果完美多了,甚至連玻璃的透明效果都能直接生成出來,重點還是:開源的。
IC-Light,可以重新打光,讓人物和背景光線完美融合,實現(xiàn)主體與背景迅速統(tǒng)一在同一光源,還是:開源的。
等等等等。
他在Github上,有無數(shù)的star,而頭像,是一個很反差很喜感的英短。
可以說,張呂敏他本人,就是整個AI繪圖領(lǐng)域的,賽博佛祖。
本人也非常的年輕,2021年本科畢業(yè)于蘇州大學,現(xiàn)在在斯坦福大學計算機科學專業(yè)讀博。
但是他,在18年,可能還沒進入大學校園時,就已經(jīng)在研究人工智能了。
18年,他發(fā)了兩款AI繪圖產(chǎn)品,一個叫Mangacaft,給黑白漫畫AI一鍵上色。一個叫Style2Paints,給線稿用AI一鍵上色。
在19年,我跟Style2Paints,還有過一段很有趣的交集。
那時候在公司,我們設(shè)計團隊發(fā)起了一個項目,是做一個小游戲,類似于王權(quán)那種左滑右滑做抉擇的。想法很美好,但是現(xiàn)實很骨感,游戲卡牌的插圖,我們?nèi)米约寒?,有整整將?00張。
那時候沒有什么AI,真的全得靠人。
我們的幾個插畫師,不眠不休肝了一兩個禮拜,肝出來了近400張線稿,然后我們對著這400張線稿犯了難,畢竟還要上色。。。那是一個比畫線稿還恐怖的工作。
我一度覺得這事不該人干,于是就去網(wǎng)上翻,翻到了lks的視頻,他推薦了一個很有趣的AI上色工具,就叫:Mangacaft。
我順著這個產(chǎn)品,找到了張呂敏的Github,找到了他的符合我需求的另一款線稿AI上色工具:Style2Paints。
然后用這個產(chǎn)品,就花了幾天時間,幫我直接搞定了屬于我的所有的上色任務(wù),然后,開開心心的摸了很多天的魚。
那時候,我還不知道他叫張呂敏,那個時候,我也更是想象不到,6年后的今天,全世界都知道了他的名字,他成了我們心中的,神。
這六年,他的初心,好像也從來沒有變過。
六年前,他的Mangacaft和Style2Paints就是在線服務(wù)免費給大家用。
而Mangacaft,收益很凄慘。
他也有過迷茫。
也有抓耳撓腮的時候。
網(wǎng)站關(guān)了開,開了關(guān),但是還是一直在開心的做著自己喜歡的事情。
就這樣,一直做,一直做。
然后,他做出了ControlNET、做出了LayerDiffusion、IC-Light、Fooocus,也做出了Omost。
現(xiàn)在,他成了張呂敏,成了我們心中的,賽博佛祖。
18年,24年。
我非常佩服他,更是非常的羨慕他,他能做到那么多人都做不到的事,把心中的美好帶給所有人,那一股子初心和激情,我非常的羨慕。
我也想成為那樣的人,但是也清楚,我實在太菜了。所以也只能做一點,我自己力所能及的小事,去盡可能的追逐他們的背影吧。
最后,我想用張呂敏曾經(jīng)轉(zhuǎn)發(fā)過的一句話做結(jié)尾,那句話,最近也挺火。
為天地立心,為生民立命,為往圣繼絕學,為萬世開太平。
我想,這就是,最大的意義吧。
以上就是關(guān)于【AI領(lǐng)域的賽博佛祖,他的名字,叫張呂敏?!康南嚓P(guān)內(nèi)容,希望對大家有幫助!
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權(quán)請聯(lián)系刪除!
-
【空谷幽蘭是什么意思】“空谷幽蘭”是一個富有詩意的成語,常用來形容在偏僻、冷清的地方生長的蘭花。它不僅...瀏覽全文>>
-
【空格怎么打出來】在日常使用電腦或手機輸入文字時,經(jīng)常會遇到需要輸入“空格”的情況。雖然看似簡單,但很...瀏覽全文>>
-
【空格怎么打】在日常使用電腦或手機時,很多人會遇到“空格怎么打”的問題。其實,“空格”是一個非?;A(chǔ)的...瀏覽全文>>
-
【空格名字怎么打】在日常使用電腦或手機時,很多人會遇到“空格名字怎么打”的問題。尤其是在輸入法設(shè)置、文...瀏覽全文>>
-
【空格鍵是指的哪一個】在日常使用電腦或手機的過程中,我們經(jīng)常接觸到各種按鍵,其中“空格鍵”是一個非?;?..瀏覽全文>>
-
【空擋是什么意思】“空擋”是一個在多個領(lǐng)域中常見的術(shù)語,尤其在汽車駕駛、機械操作以及一些比喻性表達中使...瀏覽全文>>
-
【空城舊夢是情侶網(wǎng)名嗎】“空城舊夢”這個詞語,聽起來充滿了詩意和情感色彩。它常被用于表達一種孤獨、懷念...瀏覽全文>>
-
【可吸收線是什么顏色】在醫(yī)學領(lǐng)域,尤其是外科手術(shù)中,可吸收線是一種常見的縫合材料。它主要用于縫合傷口,...瀏覽全文>>
-
【可為是什么意思】“可為”一詞源自中文,常用于表達“可以做”、“值得做”或“有作為”的含義。在不同語境...瀏覽全文>>
-
【可微與可導之間有什么聯(lián)系】在微積分的學習過程中,“可導”和“可微”是兩個經(jīng)常被提到的概念,它們看似相...瀏覽全文>>