大公三十四年年底,朱迪钚再次來到朱靖垣的住處,送上了一套最新的計算機和軟件系統。
“機器智能學習創造系統”。
類似于朱靖垣前世的人工智能,不過是一個相對完整的軟件體系。
由于朱靖垣在最開始的時候的提示和引導,朱迪钚開發模擬世界和各種游戲的過程中,一直都在孜孜不倦的研發更加真實的機器智能。
不過早期基本上只應用在游戲中,最近十來年才逐步有了其他的現實應用。
比如說人臉識別、物品分揀、駕駛輔助、智能語音等等。
最近這幾年,這些重要的基礎能力,一直都在不斷地升級換代。
同時在功能范圍上也有了新的突破。
已經可以與用戶智能聊天,可以使用語音控制設備。
可以根據標題和框架生產文章,根據關鍵點和元素生成圖像。
根據語音段落生成智能語音庫,根據游戲臺詞直接生成語音。
還可以修繕和改造現有圖片、視頻、游戲畫面和聲音。
正在提供越來越多的豐富多彩的智能化應用。
在大公三十四年底,借著新一代小型計算機量產完成,朱迪钚對這些功能做了一個歸納整理。
朱迪钚將這些功能統稱為“機器智能學習創造系統”。
朱靖垣看了之后頗為滿意,但是擺弄了一會兒卻輕輕的嘆了口氣。
大明的科技水平,開始在越來越多的方面超過前世了,但是自己也已經真的老了。
今年自己已經六十四歲了。
雖然相比兩個世界的同齡人而言,自己現在的身體狀態其實是很不錯的。
但與自己年輕時候對比,差距就越來越明顯了。
頭上的白發也越來越多了,身體也越來越不靈活了,腦子也越來越遲鈍了。
朱迪钚不知道父親為什么嘆氣。
正想要問問的時候,朱靖垣已經開口吩咐仆人了:
“叫迪鑭過來……”
然后朱靖垣開始問朱迪钚,他這些智能系統的訓練邏輯。
等到朱迪鑭過來之后,朱靖垣就讓朱迪钚給他簡單說了這些程序的情況。
然后朱靖垣直接問了一個問題:
“迪鑭,你是大宗伯和刑律院院長,主管文化與法律。
“覺得應該如何處理機器學習的使用的素材的所有權問題。”
朱迪鑭聽了之后隨口就說:
“兒臣覺得很簡單啊,直接付費授權就是了。”
朱靖垣馬上追問:
“機器學習收費的邏輯和理由是什么?立法是要有說的過去令人信服的道理的。
“如果機器學習需要收費的話,那普通人學習已經公開的書畫作品,是否也需要收費呢?”
朱迪鑭理所當然的說:
“學習本來就要付費的。
“不談學習者自己學習過程中的消耗,例如筆墨紙硯和計算機等等設備。
“也不談上學和聘請老師的費用。
“單純的自行購買學習資料,學習用的原材料和學習內容,本來就是要花錢的。”
朱靖垣伸手指著屏幕上的書畫生成軟件:
“那創作者已經免費在現實中或者互聯網公開的書畫作品,他人學習的時候顯然是不需要付費的。
“這個以別人的書畫作為學習材料的程序,也需要對所有用到的書畫作品付費嗎?
“我記得很多書畫家都在互聯網上免費公開過自己的作品。
“只要不用于盈利行為,通常都會允許別人臨摹學習,甚至還有人會主動指點。”
朱迪鑭稍微整理了一下語言:
“父皇,按照大明現有的法律,創作者主動免費公開的作品,他人不得用于任何以盈利為目的行為。
“這個盈利包括直接和間接的盈利,也包括現在不盈利但未來盈利的行為。
“那些熱心的大師們,通常也不介意他人先模仿自己的作品,再去創作風格類似的不同作品。
“只要對方不照搬他們的設計,另外用于盈利行為也無所謂。
“也覺得是理所當然的做法。
“站在律法的角度看,沒有矛盾的根本原因,還是因為沒有利益沖突。
“免費公開作品的創作者,其實有一種理所當然的,在過去也是基本正確的心態和認知。
“首先是別人除非直接抄襲,否沒辦法簡單利用自己的作品獲利。
“就算是他人學習自己的風格去再創作,也需要需要花費大量精力去完成創作。
“對方要親自動手,一個字一個字的寫,一根線條一根線條的畫。
“對方的創作速度與自己不會有明顯區別。
“絕大部分情況下,學習者的知名度和收益水平,也都不會比原創者更高。
“學習者通常還會尊敬原創者,將對方視為老師。
“這有可能為原創者帶來聲望加成,甚至有可能會帶來能夠直接提供金錢的客戶。
“這種情況下學習者和原創者之間當然沒有矛盾。
“一旦學習者與原創者使用高度相同的風格,但是學習者的作品熱度超過了原創者。
“那雙方的關系就可能會迅速下滑。
“學習者與原創者的風格類似,完成度比原創者自己更高,知名度也會超過原創者。
“就算是能夠提供收益的客戶,也會變成學習者的客戶。
“而不再是自己的潛在客戶了。
“這時候學習者就會變成發揚光大者,原創者就變成了一個點子提供者或者風格創始者。
“就算是在這樣的基礎上,只要學習者仍然尊重原創者,雙方的關系通常也不會變得太差。
“因為發揚光大者會為落寞的原創者提供額外的知名度。
“同時,發揚光大者也是一個人,創作的速度受限于人體的極限。
“在訂單增加的情況下,風格相似的原創者有機會獲得額外的實際利益。
“雙方的利益沖突仍然不明顯,利益仍然是趨同的。
“如果學習者發明了一個機器,可以將原創者的稿件投入進去,瞬間生成無數類似的高質量作品。
“并且用這些大機器生產出來的‘廉價工業品’賺大錢。
“那原創者絕對會暴怒。
“所以我們不需要什么復雜的具有說服力的理由。
“只要規定機器學習需要收費,現有的原創者絕大部分都會直接支持這種規定。
“因為機器很可能會讓他們得不到收益了,自己會被對方的機器迅速取代,失去絕大部分生存空間。
“就像傳統的手工織布工人與機械化紡織機一樣。
“不過,手工紡織工人與機械化紡織機的關系,與書畫創作者和機器學習智能繪圖的關系并不相同。
“手工紡織技術的發明者無法確定,手工紡織工人只是掌握技術的工人。
“工人的紡織過程本身不存在創造性。
“其他人發明和購買機械化紡織機器,與工人并無直接的沖突和侵權行為。
“但是,如果工人自己設計了一種紡織圖案和花紋,而不是傳承多代人的常見圖案和花紋。
“那使用機械化紡織的工廠,在未經工人許可的情況下使用相同圖案,就是法律所禁止的侵權行為。
“而機器學習的對象,恰好都是有創造性的產品,絕大部分都是有版權的產品。
“所以機器學習應該取得學習目標的版權所有人的授權。”
朱靖垣聽完之后看向朱迪钚:
“老二你認可這個理由嗎?”
朱迪钚直接說:
“鑭弟……你這樣的說法是沒有道理的,機器學習與紡織工人設計圖案的比喻也是在狡辯。
“機器學習的過程,以及后續再創作的過程,都是與人的學習沒有本質區別的。
“人學習別人的作品,本質上也是將作品元素完全打碎,變成分子乃至原子狀態存進腦子里面。
“然后再自行組合這些原子狀態的素材,組合出與原作看上去截然不同的作品。
“只是這些原子太小了,根本無法鑒別出于原作的直接雷同點。
“其實只是人類鑒定抄襲的規則基礎上,繼續向下無限細分到人類無法認知為止。
“相同的設計圖案和段落是不是抄襲?相同的人物結構和大綱算不算抄襲?
“相同的抄設計元素和詩句算不算抄襲?相同的線條風格和詞組算不算抄襲?
“相同的顏色范圍搭配和詞庫范圍算不算抄襲呢?
“這樣繼續細分下去,人類學習到最后使用可能是類似的顏色范圍和詞庫。
“機器學習的深度可能比這個更加深入和細化。
“伱用人類法律鑒定抄襲的標準,去鑒定機器學習創造出來的作品,是絕對鑒定不出抄襲來的。
“類比手工織布工匠和機械化紡織機的相同,只能算是使用了類似的棉花和顏色。
“所以為什么人類學習不算抄襲,機器干同樣的事情就是抄襲?
朱迪鑭笑著說:
“二哥你你可能理解錯了我的意思。
“我沒說機器學習和創造是抄襲,而人類的學習和創造不是抄襲。
“其實按照我自己的觀點,兩者都應該算是抄襲。
“就像二哥你說的,只要鑒定抄襲的標準無限深入,所有的學習都能夠判定為抄襲。
“在這樣的基礎上,任何免費學習過別人的藝術作品的人,都不應該創作任何以盈利為目的的作品。
“想要創造以盈利為目的的作品,本人的所有的學習資料都應該是取得了盈利授權的材料。
“因為只要學習過,顯然就會受到或多或少影響,不然也就不能稱之為學習了。
“是否為抄襲的判斷標準,更加準確的說法是允許抄襲到什么級別。
“二哥可以參考微積分和相對論的邏輯來理解這個說法。
“在這樣的基礎上,現實中的人類社會和人類創作者,已經經過實際上的社會實踐和法律,默認授權了其他人類擁有特定級別以下的抄襲盈利許可。
“但是,人類還沒有授權機器使用任何級別的抄襲盈利標準。
“比如說,我畫了一幅畫,默認允許二哥你學習畫法。
“我允許你把我的畫的原子結構甚至分子存在自己的腦子里隨時使用。
“但沒有允許你把他們存在機器里面供機器使用。
“機器要學習就要另外要授權。
“因為你說了,機器學習的邏輯,與人是相同的,但機器恰好又不是人類。
“機器學習相關又沒有任何現行法律。
“機器學習還沒有大規模出現,我并沒有直接給過它授權,更加沒有給過事實授權。
“甚至沒有給過你使用機器學習的授權。
“現在,我們要擬定相關法律,決定默認授權機器學習到什么程度。
“我的建議是全部非默認,任何用于機器學習的資料,都必須得到創作者的直接授權。
“這樣做的目的不是為了阻止機器學習繼續進化。
“恰恰是要規范機器學習行業。
“未來是大數據的時代,機器學習的規模必然會越來越大。
“如果不限制機器學習的范圍和規則,必然導致這個產業的混亂發展。
“必然導致機器學習開發者互相抄襲且不可控。
“抄襲數據原子當然不是抄襲,那抄襲數據庫肯定就是抄襲了吧?
“就像照搬一個字庫的范圍不算抄襲,但照搬一本大詞典那就絕對是抄襲了。
“在大數據和機器學習的新時代,數據資料應該是有新的權屬規范。
“任何數據和資料,都應該是有權屬的,都是有價值的。
“我認為這應該是下個時代的時代邏輯。
“有了這樣的基礎規則,有了規范的收費和授權的基本規則。
“相應的數據模型開發者,才有機會將通過有授權的數據,開發出同樣有授權的數據模型。
“進而可以不受額外限制的使用機器生產的產品去盈利。
“否則,任何機器學習最終產生的作品,其著作權歸屬都是模糊和敏感的。
“機器不是人類,所以人類可以不保護機器的著作權,完全不認可機器創作的作品的著作權。
“只有將機器視為人類的機器,創作的作品的著作權屬于其主人所有。
“才能以人類著作權的邏輯獲得保護并盈利。
“但人類想要利用別人的素材盈利,就必須獲得對方的授權了,這樣也就形成了清晰的著作權歸屬。
“透過現象看本質的話,用機械智能完成以前只有人能夠完成的工作,并且講產量和速度提升幾十幾百倍,是又一次的產業革命。
“生產力會再次跨越式的提升,技術能夠覆蓋的產品的生產成本會大幅度下降,由此產生的效益大幅度提升。
“為智能機器成功運行起來提供原料的人,有分享這種生產力提升所帶來的利益的權利。
“不能將個人欣賞學習的授權許可,用于研發和制造任何生產工具。
“這樣數據資料有價論的邏輯也就清晰了。”
朱靖垣聽完之后看向朱迪钚:
“老二你怎么看?”
朱迪钚沉默思考了幾秒鐘,最終慢慢的點著頭說:
“我覺得迪鑭的話有道理……
“用微積分的邏輯來評判和區分學習、模仿、抄襲的界限是個很不錯的理念。
“未來的公共網絡平臺上,創作者上傳自己的作品的時候。
“應該有一個是否允許機器學習的選項。
“同時也應該有一個是否使用大數據篩選和推薦信息的選項。”
朱迪鑭聽了馬上附和說:
“我贊成二哥的意見。”
朱靖垣笑著說:
“既然你們哥倆都覺得可行,那這些事情就這么定了吧。
“不過問題是,你們怎么判斷一個數據模型,是否用了未經授權的材料來訓練呢?
“在數據分析層面你們有辦法區分嗎?”
朱迪钚想了想說:
“可以在未經授權的素材中添加一些驗證數據,規避未經許可的機器學習的使用甚至污染數據模型。
“不過……單純依靠技術手段是不行的,無法完全規避違規者的破解和甄別以及反破壞技術。
“所以還是要用社會和制度層面的限制以及事后處置方法……”
朱迪钚說到這里看向了弟弟。
朱迪鑭想了想說:
“制度上有兩個方向,一個是默認全部授權,同時默認全部收費。
“目前互聯網上的大規模藝術作品平臺,都是朝廷和四大產業集團的官方平臺。
“民間廠商和用戶想要自行建立數據模型,只能從這些平臺上采集數據。
“所以可以規定,沒有向現有平臺之一付費取得授權資格的廠商,都直接按照違規處罰。
“另一個方向,是就由四大產業集團出面,各自設計一套基礎軟件框架。
“相當于一個帶有強制過濾和篩選功能的裝置。
“民間廠商做任何的數據訓練,必須在這個基礎軟件框架之上開發。
“也就是放在這個過濾裝置之內。
“這個過濾程序自動甄別未經授權的材料標記,直接不將未經授權的材料投入訓練過程。
“同時互聯網上應該在授權和未授權的材料上加入專門標記。
“供過這些濾裝置直接識別。
“這些方案可以與二哥的技術方案同步實行。”
朱迪钚聽了不由得點頭:
“好,識別和反訓練技術是必須開發的。”
朱靖垣也沒有評價兩人的設想,就讓朱迪钚和朱迪鑭哥倆商量著辦了。
(本章完)
相關