大明1805第六一六章機器智能學習創造系統

大公三十四年年底，朱迪钚再次來到朱靖垣的住處，送上了一套最新的計算機和軟件系統。

“機器智能學習創造系統”。

類似于朱靖垣前世的人工智能，不過是一個相對完整的軟件體系。

由于朱靖垣在最開始的時候的提示和引導，朱迪钚開發模擬世界和各種游戲的過程中，一直都在孜孜不倦的研發更加真實的機器智能。

不過早期基本上只應用在游戲中，最近十來年才逐步有了其他的現實應用。

比如說人臉識別、物品分揀、駕駛輔助、智能語音等等。

最近這幾年，這些重要的基礎能力，一直都在不斷地升級換代。

同時在功能范圍上也有了新的突破。

已經可以與用戶智能聊天，可以使用語音控制設備。

可以根據標題和框架生產文章，根據關鍵點和元素生成圖像。

根據語音段落生成智能語音庫，根據游戲臺詞直接生成語音。

還可以修繕和改造現有圖片、視頻、游戲畫面和聲音。

正在提供越來越多的豐富多彩的智能化應用。

在大公三十四年底，借著新一代小型計算機量產完成，朱迪钚對這些功能做了一個歸納整理。

朱迪钚將這些功能統稱為“機器智能學習創造系統”。

朱靖垣看了之后頗為滿意，但是擺弄了一會兒卻輕輕的嘆了口氣。

大明的科技水平，開始在越來越多的方面超過前世了，但是自己也已經真的老了。

今年自己已經六十四歲了。

雖然相比兩個世界的同齡人而言，自己現在的身體狀態其實是很不錯的。

但與自己年輕時候對比，差距就越來越明顯了。

頭上的白發也越來越多了，身體也越來越不靈活了，腦子也越來越遲鈍了。

朱迪钚不知道父親為什么嘆氣。

正想要問問的時候，朱靖垣已經開口吩咐仆人了：

“叫迪鑭過來……”

然后朱靖垣開始問朱迪钚，他這些智能系統的訓練邏輯。

等到朱迪鑭過來之后，朱靖垣就讓朱迪钚給他簡單說了這些程序的情況。

然后朱靖垣直接問了一個問題：

“迪鑭，你是大宗伯和刑律院院長，主管文化與法律。

“覺得應該如何處理機器學習的使用的素材的所有權問題。”

朱迪鑭聽了之后隨口就說：

“兒臣覺得很簡單啊，直接付費授權就是了。”

朱靖垣馬上追問：

“機器學習收費的邏輯和理由是什么？立法是要有說的過去令人信服的道理的。

“如果機器學習需要收費的話，那普通人學習已經公開的書畫作品，是否也需要收費呢？”

朱迪鑭理所當然的說：

“學習本來就要付費的。

“不談學習者自己學習過程中的消耗，例如筆墨紙硯和計算機等等設備。

“也不談上學和聘請老師的費用。

“單純的自行購買學習資料，學習用的原材料和學習內容，本來就是要花錢的。”

朱靖垣伸手指著屏幕上的書畫生成軟件：

“那創作者已經免費在現實中或者互聯網公開的書畫作品，他人學習的時候顯然是不需要付費的。

“這個以別人的書畫作為學習材料的程序，也需要對所有用到的書畫作品付費嗎？

“我記得很多書畫家都在互聯網上免費公開過自己的作品。

“只要不用于盈利行為，通常都會允許別人臨摹學習，甚至還有人會主動指點。”

朱迪鑭稍微整理了一下語言：

“父皇，按照大明現有的法律，創作者主動免費公開的作品，他人不得用于任何以盈利為目的行為。

“這個盈利包括直接和間接的盈利，也包括現在不盈利但未來盈利的行為。

“那些熱心的大師們，通常也不介意他人先模仿自己的作品，再去創作風格類似的不同作品。

“只要對方不照搬他們的設計，另外用于盈利行為也無所謂。

“也覺得是理所當然的做法。

“站在律法的角度看，沒有矛盾的根本原因，還是因為沒有利益沖突。

“免費公開作品的創作者，其實有一種理所當然的，在過去也是基本正確的心態和認知。

“首先是別人除非直接抄襲，否沒辦法簡單利用自己的作品獲利。

“就算是他人學習自己的風格去再創作，也需要需要花費大量精力去完成創作。

“對方要親自動手，一個字一個字的寫，一根線條一根線條的畫。

“對方的創作速度與自己不會有明顯區別。

“絕大部分情況下，學習者的知名度和收益水平，也都不會比原創者更高。

“學習者通常還會尊敬原創者，將對方視為老師。

“這有可能為原創者帶來聲望加成，甚至有可能會帶來能夠直接提供金錢的客戶。

“這種情況下學習者和原創者之間當然沒有矛盾。

“一旦學習者與原創者使用高度相同的風格，但是學習者的作品熱度超過了原創者。

“那雙方的關系就可能會迅速下滑。

“學習者與原創者的風格類似，完成度比原創者自己更高，知名度也會超過原創者。

“就算是能夠提供收益的客戶，也會變成學習者的客戶。

“而不再是自己的潛在客戶了。

“這時候學習者就會變成發揚光大者，原創者就變成了一個點子提供者或者風格創始者。

“就算是在這樣的基礎上，只要學習者仍然尊重原創者，雙方的關系通常也不會變得太差。

“因為發揚光大者會為落寞的原創者提供額外的知名度。

“同時，發揚光大者也是一個人，創作的速度受限于人體的極限。

“在訂單增加的情況下，風格相似的原創者有機會獲得額外的實際利益。

“雙方的利益沖突仍然不明顯，利益仍然是趨同的。

“如果學習者發明了一個機器，可以將原創者的稿件投入進去，瞬間生成無數類似的高質量作品。

“并且用這些大機器生產出來的‘廉價工業品’賺大錢。

“那原創者絕對會暴怒。

“所以我們不需要什么復雜的具有說服力的理由。

“只要規定機器學習需要收費，現有的原創者絕大部分都會直接支持這種規定。

“因為機器很可能會讓他們得不到收益了，自己會被對方的機器迅速取代，失去絕大部分生存空間。

“就像傳統的手工織布工人與機械化紡織機一樣。

“不過，手工紡織工人與機械化紡織機的關系，與書畫創作者和機器學習智能繪圖的關系并不相同。

“手工紡織技術的發明者無法確定，手工紡織工人只是掌握技術的工人。

“工人的紡織過程本身不存在創造性。

“其他人發明和購買機械化紡織機器，與工人并無直接的沖突和侵權行為。

“但是，如果工人自己設計了一種紡織圖案和花紋，而不是傳承多代人的常見圖案和花紋。

“那使用機械化紡織的工廠，在未經工人許可的情況下使用相同圖案，就是法律所禁止的侵權行為。

“而機器學習的對象，恰好都是有創造性的產品，絕大部分都是有版權的產品。

朱靖垣聽完之后看向朱迪钚：

“老二你認可這個理由嗎？”

朱迪钚直接說：

“鑭弟……你這樣的說法是沒有道理的，機器學習與紡織工人設計圖案的比喻也是在狡辯。

“機器學習的過程，以及后續再創作的過程，都是與人的學習沒有本質區別的。

“人學習別人的作品，本質上也是將作品元素完全打碎，變成分子乃至原子狀態存進腦子里面。

“然后再自行組合這些原子狀態的素材，組合出與原作看上去截然不同的作品。

“只是這些原子太小了，根本無法鑒別出于原作的直接雷同點。

“其實只是人類鑒定抄襲的規則基礎上，繼續向下無限細分到人類無法認知為止。

“相同的設計圖案和段落是不是抄襲？相同的人物結構和大綱算不算抄襲？

“相同的抄設計元素和詩句算不算抄襲？相同的線條風格和詞組算不算抄襲？

“相同的顏色范圍搭配和詞庫范圍算不算抄襲呢？

“這樣繼續細分下去，人類學習到最后使用可能是類似的顏色范圍和詞庫。

“機器學習的深度可能比這個更加深入和細化。

“伱用人類法律鑒定抄襲的標準，去鑒定機器學習創造出來的作品，是絕對鑒定不出抄襲來的。

“類比手工織布工匠和機械化紡織機的相同，只能算是使用了類似的棉花和顏色。

“所以為什么人類學習不算抄襲，機器干同樣的事情就是抄襲？

朱迪鑭笑著說：

“二哥你你可能理解錯了我的意思。

“我沒說機器學習和創造是抄襲，而人類的學習和創造不是抄襲。

“其實按照我自己的觀點，兩者都應該算是抄襲。

“就像二哥你說的，只要鑒定抄襲的標準無限深入，所有的學習都能夠判定為抄襲。

“在這樣的基礎上，任何免費學習過別人的藝術作品的人，都不應該創作任何以盈利為目的的作品。

“想要創造以盈利為目的的作品，本人的所有的學習資料都應該是取得了盈利授權的材料。

“因為只要學習過，顯然就會受到或多或少影響，不然也就不能稱之為學習了。

“是否為抄襲的判斷標準，更加準確的說法是允許抄襲到什么級別。

“二哥可以參考微積分和相對論的邏輯來理解這個說法。

“在這樣的基礎上，現實中的人類社會和人類創作者，已經經過實際上的社會實踐和法律，默認授權了其他人類擁有特定級別以下的抄襲盈利許可。

“但是，人類還沒有授權機器使用任何級別的抄襲盈利標準。

“比如說，我畫了一幅畫，默認允許二哥你學習畫法。

“我允許你把我的畫的原子結構甚至分子存在自己的腦子里隨時使用。

“但沒有允許你把他們存在機器里面供機器使用。

“機器要學習就要另外要授權。

“因為你說了，機器學習的邏輯，與人是相同的，但機器恰好又不是人類。

“機器學習相關又沒有任何現行法律。

“機器學習還沒有大規模出現，我并沒有直接給過它授權，更加沒有給過事實授權。

“甚至沒有給過你使用機器學習的授權。

“現在，我們要擬定相關法律，決定默認授權機器學習到什么程度。

“我的建議是全部非默認，任何用于機器學習的資料，都必須得到創作者的直接授權。

“這樣做的目的不是為了阻止機器學習繼續進化。

“恰恰是要規范機器學習行業。

“未來是大數據的時代，機器學習的規模必然會越來越大。

“如果不限制機器學習的范圍和規則，必然導致這個產業的混亂發展。

“必然導致機器學習開發者互相抄襲且不可控。

“抄襲數據原子當然不是抄襲，那抄襲數據庫肯定就是抄襲了吧？

“就像照搬一個字庫的范圍不算抄襲，但照搬一本大詞典那就絕對是抄襲了。

“在大數據和機器學習的新時代，數據資料應該是有新的權屬規范。

“任何數據和資料，都應該是有權屬的，都是有價值的。

“我認為這應該是下個時代的時代邏輯。

“有了這樣的基礎規則，有了規范的收費和授權的基本規則。

“相應的數據模型開發者，才有機會將通過有授權的數據，開發出同樣有授權的數據模型。

“進而可以不受額外限制的使用機器生產的產品去盈利。

“否則，任何機器學習最終產生的作品，其著作權歸屬都是模糊和敏感的。

“機器不是人類，所以人類可以不保護機器的著作權，完全不認可機器創作的作品的著作權。

“只有將機器視為人類的機器，創作的作品的著作權屬于其主人所有。

“才能以人類著作權的邏輯獲得保護并盈利。

“但人類想要利用別人的素材盈利，就必須獲得對方的授權了，這樣也就形成了清晰的著作權歸屬。

“透過現象看本質的話，用機械智能完成以前只有人能夠完成的工作，并且講產量和速度提升幾十幾百倍，是又一次的產業革命。

“生產力會再次跨越式的提升，技術能夠覆蓋的產品的生產成本會大幅度下降，由此產生的效益大幅度提升。

“為智能機器成功運行起來提供原料的人，有分享這種生產力提升所帶來的利益的權利。

“不能將個人欣賞學習的授權許可，用于研發和制造任何生產工具。

“這樣數據資料有價論的邏輯也就清晰了。”

朱靖垣聽完之后看向朱迪钚：

“老二你怎么看？”

朱迪钚沉默思考了幾秒鐘，最終慢慢的點著頭說：

“我覺得迪鑭的話有道理……

“用微積分的邏輯來評判和區分學習、模仿、抄襲的界限是個很不錯的理念。

“未來的公共網絡平臺上，創作者上傳自己的作品的時候。

“應該有一個是否允許機器學習的選項。

“同時也應該有一個是否使用大數據篩選和推薦信息的選項。”

朱迪鑭聽了馬上附和說：

“我贊成二哥的意見。”

朱靖垣笑著說：

“既然你們哥倆都覺得可行，那這些事情就這么定了吧。

“不過問題是，你們怎么判斷一個數據模型，是否用了未經授權的材料來訓練呢？

“在數據分析層面你們有辦法區分嗎？”

朱迪钚想了想說：

“可以在未經授權的素材中添加一些驗證數據，規避未經許可的機器學習的使用甚至污染數據模型。

“不過……單純依靠技術手段是不行的，無法完全規避違規者的破解和甄別以及反破壞技術。

“所以還是要用社會和制度層面的限制以及事后處置方法……”

朱迪钚說到這里看向了弟弟。

朱迪鑭想了想說：

“制度上有兩個方向，一個是默認全部授權，同時默認全部收費。

“目前互聯網上的大規模藝術作品平臺，都是朝廷和四大產業集團的官方平臺。

“民間廠商和用戶想要自行建立數據模型，只能從這些平臺上采集數據。

“所以可以規定，沒有向現有平臺之一付費取得授權資格的廠商，都直接按照違規處罰。

“另一個方向，是就由四大產業集團出面，各自設計一套基礎軟件框架。

“相當于一個帶有強制過濾和篩選功能的裝置。

“民間廠商做任何的數據訓練，必須在這個基礎軟件框架之上開發。

“也就是放在這個過濾裝置之內。

“這個過濾程序自動甄別未經授權的材料標記，直接不將未經授權的材料投入訓練過程。

“同時互聯網上應該在授權和未授權的材料上加入專門標記。

“供過這些濾裝置直接識別。

“這些方案可以與二哥的技術方案同步實行。”

朱迪钚聽了不由得點頭：

“好，識別和反訓練技術是必須開發的。”

朱靖垣也沒有評價兩人的設想，就讓朱迪钚和朱迪鑭哥倆商量著辦了。

(本章完)

相關

第六一六章 機器智能學習創造系統

第六一六章機器智能學習創造系統