法律領(lǐng)域?qū)Ψ纱竽P偷哪軇?dòng)塑造 王祿生 東南大學(xué)法學(xué)院教授、未來法治與數(shù)智技術(shù)創(chuàng)新實(shí)驗(yàn)室研究員
本文發(fā)表于《中國法學(xué)》2025年第3期,因篇幅限制,注釋省略。作者身份信息為發(fā)文時(shí)信息。
內(nèi)容提要
法律大模型是兼具技術(shù)屬性與社會(huì)屬性的大型技術(shù)系統(tǒng)。法律領(lǐng)域通過對價(jià)值追求、知識(shí)基礎(chǔ)、組織偏好、制度準(zhǔn)備、認(rèn)知結(jié)構(gòu)的多重引導(dǎo),調(diào)控法律領(lǐng)域數(shù)據(jù)、知識(shí)、組織、制度、符號(hào)等資源的生產(chǎn)、供給與配置,從而能動(dòng)塑造法律大模型的功能表征、應(yīng)用場景與擴(kuò)散路徑。中國法律領(lǐng)域的資源稟賦與資源困境在技術(shù)動(dòng)力與技術(shù)約束兩個(gè)層面塑造中國法律大模型的技術(shù)風(fēng)格。因此,不應(yīng)將法律領(lǐng)域單純視作法律大模型的應(yīng)用場景和改造對象,而應(yīng)賦予其破除法律領(lǐng)域資源困境的能動(dòng)地位。這就要求以推動(dòng)中國法律大模型自主創(chuàng)新為總體目標(biāo),協(xié)同領(lǐng)域內(nèi)多層次意圖形成一致性能動(dòng)塑造行動(dòng)。在此基礎(chǔ)上,以組織資源為中心化約各資源之間的復(fù)雜互動(dòng)關(guān)系,構(gòu)建法律領(lǐng)域資源的優(yōu)化方案,打造符合中國式法治現(xiàn)代化核心要求的法律大模型技術(shù)風(fēng)格。
關(guān)鍵詞
法律領(lǐng)域 法律大模型 生成式人工智能 系統(tǒng)理論 能動(dòng)塑造
目 次
一、引言
二、法律領(lǐng)域能動(dòng)塑造法律大模型的理論基礎(chǔ)
三、中國法律大模型的法律領(lǐng)域資源稟賦與資源困境 四、面向能動(dòng)塑造中國法律大模型的法律領(lǐng)域資源優(yōu)化 五、結(jié)語
一、引 言
2022年末以來,大語言模型加速迭代并日益在通用任務(wù)上表現(xiàn)出良好的泛化能力與涌現(xiàn)特征。然而,通用大模型廣而不專、全而不精的特點(diǎn)勢必催生其深度適配法律、醫(yī)療等垂直領(lǐng)域的時(shí)代需求。一般認(rèn)為,非人智能體使法律人感到生存危機(jī)需要具備三個(gè)前提:不亞于法律人的專業(yè)技能;自主生長性,甚至產(chǎn)生意識(shí);法律人與AI產(chǎn)生非常廣泛且日?;纳媛?lián)結(jié)。從長遠(yuǎn)看,法律大模型可能改變法律知識(shí)的生產(chǎn)方式,并在諸多法律業(yè)務(wù)中展示出值得期待的潛力;同時(shí),法律大模型在大參數(shù)訓(xùn)練基礎(chǔ)上表現(xiàn)出來針對法律任務(wù)的涌現(xiàn)與泛化能力已經(jīng)具備最初級(jí)層次的“自生長性”;更進(jìn)一步,法律大模型的推廣可能建立人機(jī)協(xié)作的法律業(yè)務(wù)模式,從而形成與法律人日常業(yè)務(wù)的泛在聯(lián)結(jié)。盡管諸多對未來的暢想暗含AI取代法律人的隱喻,但該危機(jī)此前一直并不緊迫。法律大模型的出現(xiàn),則可能意味著法律人主體性自我消解的序曲已經(jīng)奏響。
總體而言,學(xué)界當(dāng)前圍繞法律大模型的專題研究相對有限,且聚焦硬幣的一面,即法律大模型對法律實(shí)踐、法律組織和法律職業(yè)的塑造作用。關(guān)于硬幣的另一面——“法律領(lǐng)域影響法律大模型”的研究則更為缺乏。從已有研究看,法律組織與法律職業(yè)者對法律大模型的影響是消極乃至消隱的:其要么被視作法律大模型的應(yīng)用者,并可能因?yàn)榧夹g(shù)素養(yǎng)不足導(dǎo)致技術(shù)推廣不力;要么被視作受技術(shù)“改造”的對象,因?yàn)閾?dān)心被取代而消極對待。在此敘事框架中,法律領(lǐng)域行動(dòng)者被動(dòng)卷入科技規(guī)訓(xùn)大潮,“順從”地成為法律科技塑造法律現(xiàn)代性的自然延伸。上述視角過于簡化了法律大模型的研發(fā)與應(yīng)用邏輯。事實(shí)上,法律大模型并非獨(dú)立于法律領(lǐng)域的“自主存在”,而是深深嵌入法律領(lǐng)域的數(shù)據(jù)、知識(shí)、組織、制度與符號(hào)資源之中,法律大模型的研發(fā)與應(yīng)用結(jié)果由技術(shù)領(lǐng)域與法律領(lǐng)域共同塑造。這也是為何盡管具有相似的技術(shù)屬性,但法律大模型在不同國家的推廣差異顯著,有的方興未艾,有的淺嘗輒止;不同主體可能基于不同目的使用同一法律大模型技術(shù),但其應(yīng)用樣態(tài)可能相去甚遠(yuǎn)。
本文嘗試探討法律領(lǐng)域?qū)Ψ纱竽P偷哪軇?dòng)塑造作用。具體而言,首先在理論基礎(chǔ)層面揭示法律大模型兼具技術(shù)性與社會(huì)性的“大型技術(shù)系統(tǒng)”本質(zhì),以及法律領(lǐng)域如何對其能動(dòng)塑造的深層機(jī)理;其次,分析中國法律領(lǐng)域的資源稟賦如何塑造中國法律大模型的技術(shù)風(fēng)格,并在此基礎(chǔ)上梳理中國法律領(lǐng)域的資源困境給中國法律大模型帶來的系統(tǒng)性約束;最后,基于能動(dòng)塑造理論,面向中國法律大模型的自主創(chuàng)新,提出破解法律領(lǐng)域資源困境的系統(tǒng)性方案。
二、法律領(lǐng)域能動(dòng)塑造法律大模型的理論基礎(chǔ)
法律領(lǐng)域能動(dòng)塑造法律大模型的理論將法律大模型視作大型技術(shù)系統(tǒng),認(rèn)為法律領(lǐng)域的數(shù)據(jù)、知識(shí)、組織、制度、符號(hào)等資源通過相互作用,共同塑造該技術(shù)在法律領(lǐng)域的功能表征與最終形態(tài)。在該理論框架下,法律大模型既非本質(zhì)主義的自主力量,亦非工具主義脫離領(lǐng)域目標(biāo)的中立對象。技術(shù)先進(jìn)性只是法律大模型研發(fā)、應(yīng)用與擴(kuò)散的必要非充分條件,法律領(lǐng)域可以通過對價(jià)值追求、知識(shí)基礎(chǔ)、組織偏好、制度準(zhǔn)備、認(rèn)知結(jié)構(gòu)等進(jìn)行目的性調(diào)控與引導(dǎo),影響法律領(lǐng)域資源的生產(chǎn)、供給與配置,最終完成對法律大模型的能動(dòng)塑造。
(一)作為大型技術(shù)系統(tǒng)的法律大模型
大型技術(shù)系統(tǒng)(large technological system)由技術(shù)史與科技社會(huì)學(xué)學(xué)者托馬斯·休斯提出,意指那些規(guī)模龐大、復(fù)雜性高,涉及眾多技術(shù)組件(如物理設(shè)備)與社會(huì)要素(如組織架構(gòu)、技術(shù)標(biāo)準(zhǔn)、法律法規(guī))的系統(tǒng),比如電力、鐵路、電信等。相較于一般技術(shù)系統(tǒng)而言,大型技術(shù)系統(tǒng)的“技術(shù)動(dòng)量”(technological momentum)使其在發(fā)展過程中不斷累積技術(shù)慣性,并在系統(tǒng)擴(kuò)展和成熟后因失去可塑性和靈活性而愈發(fā)難以改變或停止。
法律(垂域)大模型是專門設(shè)計(jì)用于法律領(lǐng)域,旨在滿足法律場景對準(zhǔn)確性、公正性的嚴(yán)格要求,具有極強(qiáng)法律語言理解、專業(yè)任務(wù)泛化和可信知識(shí)生成能力的一種基于大語言模型的生成式人工智能系統(tǒng)。它在本質(zhì)上是由大語言模型的硬件組件(如算力、能源基礎(chǔ)設(shè)施)與作為社會(huì)要素的法律領(lǐng)域共同組成的大型技術(shù)系統(tǒng),兼具技術(shù)屬性與社會(huì)屬性。首先,法律大模型作為法律領(lǐng)域新型基礎(chǔ)設(shè)施,包含與用戶互動(dòng)的前端系統(tǒng)應(yīng)用,訓(xùn)練與運(yùn)行需要依托的服務(wù)器、云存儲(chǔ)等計(jì)算基礎(chǔ)設(shè)施,以及支撐訓(xùn)練與推理的能源基礎(chǔ)設(shè)施。其次,在法律大模型研發(fā)與應(yīng)用過程中,技術(shù)組件與社會(huì)要素密不可分,它既受制于人工智能技術(shù)的創(chuàng)新發(fā)展,又受制于法律領(lǐng)域圍繞技術(shù)創(chuàng)新與應(yīng)用的價(jià)值追求、組織偏好、制度準(zhǔn)備、認(rèn)知結(jié)構(gòu)的交織影響??梢姡瑢?shí)現(xiàn)特定目的的硬件設(shè)備、特定的技能和知識(shí)、龐大的物理架構(gòu)以及組織的科層體制等都是法律大模型發(fā)展的動(dòng)力之源,決定著法律大模型增長的持續(xù)性與演變的傾向性?!凹夹g(shù)發(fā)展的不順利,問題常常主要地不在技術(shù)本身,甚至也不在單一的社會(huì)原因,而在復(fù)雜的社會(huì)條件?!碑?dāng)技術(shù)創(chuàng)新無法與法律領(lǐng)域相容時(shí),法律大模型的發(fā)展方向與速度均會(huì)受到實(shí)質(zhì)制約。最后,在法律大模型的發(fā)展初期,由于“技術(shù)動(dòng)量”不足,技術(shù)具有高度的靈活性和適應(yīng)性,因此更可能受到法律領(lǐng)域的能動(dòng)塑造。隨著法律大模型的技術(shù)擴(kuò)散與深度應(yīng)用,其“技術(shù)動(dòng)量”日益積累并形成對法律領(lǐng)域不可逆的影響。
(二)作為行動(dòng)領(lǐng)域與資源系統(tǒng)的法律領(lǐng)域
法律領(lǐng)域可以被理解為具有獨(dú)特價(jià)值目標(biāo)、動(dòng)態(tài)權(quán)力結(jié)構(gòu)、系統(tǒng)規(guī)范體系和明確行為準(zhǔn)則的功能性行動(dòng)領(lǐng)域與復(fù)雜性資源系統(tǒng)。對外而言,法律領(lǐng)域是現(xiàn)代社會(huì)功能分化出的不可互相替代的社會(huì)子系統(tǒng),通過參照其與社會(huì)整體、相鄰子系統(tǒng)以及自身的關(guān)系而維持自主運(yùn)行;在此過程中,法律領(lǐng)域通過創(chuàng)造和維護(hù)與環(huán)境的差異來建構(gòu)自我,并利用系統(tǒng)邊界來調(diào)節(jié)這種差異,從而實(shí)現(xiàn)“自我指涉”的功能運(yùn)作。對內(nèi)而言,法律領(lǐng)域則是一個(gè)由特定規(guī)則、邏輯和權(quán)力關(guān)系構(gòu)成的自主行動(dòng)領(lǐng)域,行動(dòng)者按照法律領(lǐng)域自身的符碼、綱要與程序邏輯生成意義并構(gòu)建資源要素的再生產(chǎn)結(jié)構(gòu)。法律領(lǐng)域通過數(shù)據(jù)、知識(shí)、組織、制度、符號(hào)等資源的生產(chǎn)、供給與配置,不斷調(diào)整領(lǐng)域的結(jié)構(gòu)與功能,塑造自身的復(fù)雜性、多樣性與動(dòng)態(tài)性。更進(jìn)一步,根據(jù)社會(huì)系統(tǒng)“運(yùn)作封閉”但“認(rèn)知開放”的特性,法律領(lǐng)域在確保自身獨(dú)立性的前提下仍需與其他領(lǐng)域形成資源交換,從而維持自身的生產(chǎn)與供給。可見,法律領(lǐng)域存在功能性或結(jié)構(gòu)性的“能動(dòng)性”,這種能動(dòng)性在維持自我指涉中得以體現(xiàn),也即通過內(nèi)部溝通和結(jié)構(gòu)耦合對外部環(huán)境擾動(dòng)作出響應(yīng)。與法律大模型的“硬”組件相比,法律領(lǐng)域從技術(shù)基礎(chǔ)、理論積累、協(xié)作機(jī)制、規(guī)范保障、文化認(rèn)同等“軟”維度為法律大模型研發(fā)與應(yīng)用全鏈條提供不可替代的資源支撐。
法律領(lǐng)域數(shù)據(jù)資源是指用以支持法律大模型預(yù)訓(xùn)練、優(yōu)化與運(yùn)行的,以法律文書(包括裁判文書、合同文本等)、法律法規(guī)、法學(xué)論文等為代表的數(shù)據(jù)資源。法律領(lǐng)域數(shù)據(jù)資源由法律組織與法律職業(yè)群體在法律實(shí)踐過程中不斷產(chǎn)生,其生成過程嵌入了法律職業(yè)群體的價(jià)值追求、專業(yè)知識(shí)、實(shí)踐經(jīng)驗(yàn),是法律領(lǐng)域共識(shí)的直接體現(xiàn)。相較于一般的數(shù)據(jù)資源而言,法律領(lǐng)域數(shù)據(jù)資源具有高度的專業(yè)性、權(quán)威性和規(guī)范性。
法律領(lǐng)域知識(shí)資源特指法律大模型研發(fā)過程中數(shù)據(jù)標(biāo)注、價(jià)值對齊、指令微調(diào)等技術(shù)知識(shí),以及法律大模型運(yùn)用過程中法律提示、信息辨識(shí)、風(fēng)險(xiǎn)規(guī)避等技術(shù)素養(yǎng)。波蘭尼的知識(shí)論包含顯性知識(shí)與默會(huì)知識(shí)的二元區(qū)分。其中,顯性知識(shí)主要以書面文字、圖表和數(shù)學(xué)公式表達(dá);默會(huì)知識(shí)則主要是指難以表達(dá)的、具有個(gè)體特質(zhì)與情境依賴的實(shí)踐性知識(shí)。就法律大模型而言,以法律科技界的技術(shù)積累為核心的顯性知識(shí)與以法律理論界、實(shí)務(wù)界的技術(shù)素養(yǎng)為核心的默會(huì)知識(shí),共同構(gòu)成了法律領(lǐng)域知識(shí)資源。兩者的形成均源于法律習(xí)慣、價(jià)值、文化的共同塑造,在技術(shù)知識(shí)方面體現(xiàn)為嵌入法律專業(yè)知識(shí)和法律場景需求的客觀知識(shí)體系,在技術(shù)素養(yǎng)方面則表現(xiàn)為具體法律情境中使用技術(shù)的實(shí)踐經(jīng)驗(yàn)?zāi)Y(jié)。
法律領(lǐng)域組織資源是指支撐法律大模型研發(fā)、應(yīng)用與擴(kuò)散的,以組織偏好、組織結(jié)構(gòu)與組織能力為核心內(nèi)涵的資源網(wǎng)絡(luò)。組織理論框架下對于技術(shù)的研究,經(jīng)歷了從強(qiáng)調(diào)決定論意義上技術(shù)對組織的影響到強(qiáng)調(diào)技術(shù)與組織互動(dòng)的范式變遷。在上述轉(zhuǎn)變過程中,組織對技術(shù)的塑造作用日益受到關(guān)注,并逐步成為影響技術(shù)演化的關(guān)鍵資源。法律領(lǐng)域組織資源具有鮮明的領(lǐng)域特征。一方面,法律領(lǐng)域內(nèi)各類組織的偏好深受法律職業(yè)者在個(gè)體與群體兩個(gè)層面的塑造。具體而言,個(gè)體法律職業(yè)者的行為偏好通過法律實(shí)踐的日常積累產(chǎn)生對法律組織偏好的微觀影響。在此基礎(chǔ)上,異質(zhì)性的個(gè)體偏好依托組織環(huán)境實(shí)現(xiàn)協(xié)調(diào)與整合,逐步匯聚形成法律組織的整體偏好。另一方面,在結(jié)構(gòu)功能主義框架下,法律領(lǐng)域各類組織的結(jié)構(gòu)彈性又受到組織功能定位的深度影響。
法律領(lǐng)域制度資源是支持和規(guī)范法律大模型開發(fā)與應(yīng)用的各類正式與非正式的政策指引、行業(yè)標(biāo)準(zhǔn)、倫理規(guī)范等。制度資源通過正式規(guī)則、非正式規(guī)范、物質(zhì)手段和話語框架的有機(jī)組合,對法律領(lǐng)域的科技創(chuàng)新與應(yīng)用施加各層面的激勵(lì)與約束。值得注意的是,法律領(lǐng)域制度資源并非所有社會(huì)現(xiàn)象的制度資源,而是特指由法律領(lǐng)域組織在個(gè)體與整體層面生產(chǎn)的,針對法律科技研發(fā)與應(yīng)用的各類制度規(guī)范的總稱。 法律領(lǐng)域符號(hào)資源是指法律領(lǐng)域職業(yè)群體與接受法律服務(wù)的社會(huì)公眾對法律大模型的認(rèn)可和接受度。
法律領(lǐng)域符號(hào)資源受法律領(lǐng)域思維模式、知識(shí)框架、決策邏輯等認(rèn)知機(jī)制塑造。布迪厄認(rèn)為符號(hào)資本是個(gè)體或群體在特定社會(huì)環(huán)境中獲得的尊重、榮譽(yù)、聲望和認(rèn)可等以符號(hào)方式存在的資本,其本質(zhì)是以認(rèn)可和聲望為基礎(chǔ)的資源,具有無形性、象征性和稀缺性。我們可以將與榮譽(yù)、聲望相關(guān)的資本視作法律大模型的符號(hào)資源,即由于法律組織與法律職業(yè)群體認(rèn)可以及信任等非物質(zhì)因素構(gòu)成的一種法律領(lǐng)域總體層面的信任和預(yù)期。
(三)法律領(lǐng)域?qū)Ψ纱竽P偷哪軇?dòng)塑造機(jī)理
法律領(lǐng)域的整體能動(dòng)性并非指向“意識(shí)主體”,而是指其作為一個(gè)行動(dòng)領(lǐng)域與資源系統(tǒng),通過集體行為、文化規(guī)范、制度安排等方式,調(diào)控各類領(lǐng)域資源生產(chǎn)與供給,進(jìn)而塑造法律大模型的功能表征、應(yīng)用規(guī)范與社會(huì)接受度。法律大模型并非獨(dú)立于社會(huì)時(shí)空的“自主存在”,而是深深嵌入法律領(lǐng)域之中的大型技術(shù)系統(tǒng)。
1. 法律領(lǐng)域數(shù)據(jù)資源對法律大模型的能動(dòng)塑造機(jī)理
法律領(lǐng)域數(shù)據(jù)資源的可及性和可用性直接影響法律大模型生成內(nèi)容的全面性、實(shí)用性、時(shí)效性與準(zhǔn)確性,進(jìn)而深度塑造其法律語言理解、法律任務(wù)泛化和可信知識(shí)生成能力。其中,對法律法規(guī)數(shù)據(jù)的預(yù)訓(xùn)練有助于強(qiáng)化大語言模型對法律條文體系結(jié)構(gòu)、邏輯關(guān)聯(lián)和規(guī)范內(nèi)容的“理解”,增進(jìn)其運(yùn)用法律規(guī)則解決法律問題的能力。同時(shí),對法律文書的預(yù)訓(xùn)練有助于大語言模型加強(qiáng)對法律表達(dá)的理解與應(yīng)用,強(qiáng)化對法律案例的分析,并優(yōu)化在法律咨詢和法律論證等場景的表現(xiàn)。此外,若能充分利用電子合同等巨量法律文書資源,將有利于加強(qiáng)法律大模型在合同生成、解釋、分析等任務(wù)中的表現(xiàn)。更進(jìn)一步,對法學(xué)論文的預(yù)訓(xùn)練能夠幫助法律大模型加深對法學(xué)理論的掌握,提升其在法學(xué)認(rèn)識(shí)論和方法論層面的能力,優(yōu)化其在法律思維和法律邏輯推理方面的表現(xiàn)。
2. 法律領(lǐng)域知識(shí)資源對法律大模型的能動(dòng)塑造機(jī)理
法律大模型開發(fā)與應(yīng)用的法律領(lǐng)域顯性知識(shí)主要包括:針對法律場景特定任務(wù)而設(shè)計(jì)和訓(xùn)練的各類算法;數(shù)據(jù)采集、清洗、標(biāo)注、管理的技術(shù)規(guī)范;開發(fā)和部署法律人工智能系統(tǒng)的行業(yè)標(biāo)準(zhǔn)與工程方案等。法律領(lǐng)域顯性知識(shí)為法律大模型的研發(fā)和應(yīng)用提供了可復(fù)制、可操作、可驗(yàn)證、可傳播的知識(shí)基礎(chǔ)與實(shí)踐框架,有利于技術(shù)開發(fā)與應(yīng)用的標(biāo)準(zhǔn)化和一致性。與之對應(yīng),法律領(lǐng)域默會(huì)知識(shí)主要包括經(jīng)驗(yàn)與技巧層面的法律人使用法律大模型的技術(shù)素養(yǎng)。其中,技術(shù)認(rèn)知素養(yǎng)決定了法律領(lǐng)域行動(dòng)主體對法律大模型的感知和理解,并深刻塑造該技術(shù)被實(shí)際使用的方式;提示素養(yǎng)決定法律領(lǐng)域用戶能否高效、準(zhǔn)確與法律大模型進(jìn)行交互,并影響生成內(nèi)容的準(zhǔn)確性與可用性;信息辨識(shí)素養(yǎng)決定了法律領(lǐng)域用戶能否區(qū)分法律大模型生成內(nèi)容的準(zhǔn)確性與可靠性,從而有效避免知識(shí)幻覺,并確保人在回路的決策方式。在技術(shù)效能相同或相近的情況下,法律職業(yè)群體的技術(shù)素養(yǎng)(知識(shí)資源)將會(huì)在根本上影響其對法律大模型的理解與使用。
3. 法律領(lǐng)域組織資源對法律大模型的能動(dòng)塑造機(jī)理
法律組織通過技術(shù)偏好、結(jié)構(gòu)彈性、實(shí)踐場景限制和引導(dǎo)法律大模型的采用與實(shí)施。首先,組織技術(shù)偏好(文化)影響對技術(shù)比較優(yōu)勢、兼容性、復(fù)雜性的判斷,決定了組織對技術(shù)創(chuàng)新的采納。當(dāng)法律大模型能夠契合法律組織業(yè)務(wù)需求時(shí),該技術(shù)更可能被廣泛使用并加速擴(kuò)散。其次,法律組織的結(jié)構(gòu)特點(diǎn),及其內(nèi)部外部、橫向縱向之間所表現(xiàn)出來的組織彈性,決定了法律組織在面對法律大模型所帶來的機(jī)會(huì)與挑戰(zhàn)時(shí),對其進(jìn)行因應(yīng)、吸收并轉(zhuǎn)化為實(shí)際效能的可能性。最后,法律大模型通過同形壓力和同儕競爭得以在組織間擴(kuò)散。當(dāng)法律大模型的研發(fā)應(yīng)用成為一種行業(yè)普遍的潮流趨向,并演化為一種法律組織的壓力與目標(biāo)時(shí),法律組織為了增加自身的制度合法性,會(huì)在競爭性自我調(diào)適中相互模仿,并最終在推動(dòng)法律大模型創(chuàng)新與運(yùn)用方面趨于“同形”。隨著法律大模型在法律組織間擴(kuò)散,法律組織本身成為其擴(kuò)散的支持資源。
4. 法律領(lǐng)域制度資源對法律大模型的能動(dòng)塑造機(jī)理
不同層次和不同屬性的法律領(lǐng)域制度資源通過激勵(lì)或約束的方式影響法律大模型的研發(fā)與應(yīng)用。其中,政策指引是指各層級(jí)政法機(jī)關(guān)出臺(tái)的引導(dǎo)與規(guī)范法律科技研發(fā)與應(yīng)用的各類指導(dǎo)性文件的總稱。政策指引能夠在不同顆粒度上引導(dǎo)法律科技的發(fā)展方向、優(yōu)化法律領(lǐng)域資金和資源配置,并有效管控法律科技風(fēng)險(xiǎn)。行業(yè)標(biāo)準(zhǔn)通過標(biāo)準(zhǔn)化流程和技術(shù)指標(biāo)的設(shè)定塑造法律大模型的技術(shù)有效性、正當(dāng)性與合法性框架。倫理規(guī)范為法律大模型的開發(fā)與使用提供倫理約束和底線標(biāo)準(zhǔn),保障法律大模型在高速發(fā)展的同時(shí)兼顧對倫理正當(dāng)性的關(guān)注。
5. 法律領(lǐng)域符號(hào)資源對法律大模型的能動(dòng)塑造機(jī)理
法律領(lǐng)域符號(hào)資源供給的實(shí)質(zhì)是法律大模型潛在用戶的態(tài)度、價(jià)值觀和信念趨同的過程。該資源通過影響法律領(lǐng)域行動(dòng)主體的主觀認(rèn)知而塑造法律大模型的研發(fā)、采用與擴(kuò)散。這也是為何有學(xué)者認(rèn)為,在決定采用技術(shù)時(shí),圍繞技術(shù)感知形成的社會(huì)力量比技術(shù)的物理屬性更加重要。當(dāng)法律領(lǐng)域?qū)Ψ纱竽P透叨刃湃螘r(shí),意味著該技術(shù)符合領(lǐng)域的價(jià)值觀與符號(hào)體系,領(lǐng)域內(nèi)行動(dòng)主體將會(huì)對其產(chǎn)生更多期待,進(jìn)而鼓勵(lì)相關(guān)主體投入更多資源支撐該技術(shù)的研發(fā)。因此,符號(hào)資源在很大程度上決定了技術(shù)最初被采用。更進(jìn)一步,在法律大模型發(fā)展過程中,法律領(lǐng)域內(nèi)行動(dòng)主體的共同認(rèn)可及專業(yè)信任會(huì)進(jìn)一步降低推廣阻力、提升擴(kuò)散速度。值得注意的是,技術(shù)的準(zhǔn)確度并非主體對模型信任的充分必要條件,社會(huì)群體對法律大模型的信任度還與法律大模型背后算法的可解釋性與透明度相關(guān)。
三、中國法律大模型的法律領(lǐng)域資源稟賦與資源困境 法律大模型并非單純給法律領(lǐng)域施加影響的“技術(shù)物”,而是深受法律領(lǐng)域資源影響的“社會(huì)—技術(shù)物”。正因如此,中國法律大模型研發(fā)與應(yīng)用在遵循技術(shù)邏輯的同時(shí),還需要充分關(guān)注中國法律領(lǐng)域的資源稟賦與資源困境在技術(shù)動(dòng)力與技術(shù)約束兩個(gè)層面的綜合影響。
(一)中國法律大模型的法律領(lǐng)域資源稟賦
中國法律領(lǐng)域的數(shù)據(jù)資源、知識(shí)資源、組織資源、制度資源和符號(hào)資源的充分積累所形成的資源稟賦塑造了中國法律大模型的技術(shù)選擇、路徑依賴與發(fā)展模式,形成具有鮮明政策導(dǎo)向與應(yīng)用驅(qū)動(dòng)的技術(shù)風(fēng)格。
1. 法律領(lǐng)域數(shù)據(jù)資源稟賦
中國法律領(lǐng)域的全方位數(shù)字化轉(zhuǎn)型為法律大模型的訓(xùn)練積累了存量豐富的領(lǐng)域數(shù)據(jù)資源。該數(shù)據(jù)資源決定了中國法律大模型本土化深耕和中文定制化的總體技術(shù)風(fēng)格,以及適應(yīng)中國語境的法律語義理解、法律推理和法律決策的目標(biāo)定位。在法律法規(guī)方面,各種大型法律法規(guī)數(shù)據(jù)庫的建設(shè)為法律大模型的開發(fā)提供了天然的訓(xùn)練數(shù)據(jù)集。例如,國家法律法規(guī)數(shù)據(jù)庫作為由國家立法機(jī)關(guān)建設(shè)的官方數(shù)據(jù)庫,收錄了包括憲法、現(xiàn)行有效法律、法律解釋、地方性法規(guī)等法律文本近2.65萬件,涵蓋了中國特色社會(huì)主義法律體系最主要的內(nèi)容。在法律文書方面,國家與社會(huì)層面電子化法律文書的海量積累能夠?yàn)榉纱竽P吞峁┏浞种С?。雖然在線公開的裁判文書為各法律人工智能研發(fā)主體提供了重要的支撐,但已公開部分僅是全社會(huì)法律文書數(shù)據(jù)資源池中非常有限的部分,比如僅2023年中國電子合同的簽約數(shù)量就達(dá)1337.1億份。在法學(xué)論文方面,存量巨大、增量可觀的電子化法學(xué)論文文獻(xiàn)也是中國法律大模型的重要數(shù)字資源基礎(chǔ),僅最高人民法院數(shù)字圖書館就聚集了達(dá)1.929萬億字的1.505億篇文獻(xiàn)。
2. 法律領(lǐng)域知識(shí)資源稟賦
在科技創(chuàng)新領(lǐng)域新型舉國體制逐步健全的背景下,依托科技部國家重點(diǎn)研發(fā)計(jì)劃在公共安全、智慧司法等領(lǐng)域的項(xiàng)目布局,我國圍繞法律大數(shù)據(jù)、法律人工智能領(lǐng)域產(chǎn)出了一批關(guān)鍵的算法與模型,形成中國法律大模型研發(fā)的重要顯性知識(shí)基礎(chǔ)。有數(shù)據(jù)顯示,早在2018年,全球申請的法律科技專利中就有超過一半(51%)來自中國;次年,中國法律科技專利的占比更是上升到了61.9%。近年來,清華大學(xué)、北京大學(xué)、浙江大學(xué)、復(fù)旦大學(xué)、山東大學(xué)、東南大學(xué)等高校先后發(fā)布了PowerLawGLM、ChatLaw、智?!や泦枴ISC-LawLLM、夫子·明察、法衡等法律大模型。各科技公司也積極開發(fā)智慧法律系統(tǒng)、法律智能助手等面向法律行業(yè)的大模型產(chǎn)品與應(yīng)用。可見,當(dāng)前各領(lǐng)域圍繞法律人工智能的深入探索為法律大模型的研發(fā)提供了較多的顯性知識(shí)資源。
在默會(huì)知識(shí)方面,中國數(shù)字法治實(shí)踐中“百花齊放”與“全體總動(dòng)員式”的繁榮面貌助推了法律領(lǐng)域圍繞法律科技的知識(shí)啟蒙。正如技術(shù)社會(huì)塑造主義者認(rèn)為的那樣,行動(dòng)者傾向于通過熟悉的模式或者框架來理解新技術(shù)。一方面,法律領(lǐng)域的組織與個(gè)體在數(shù)字化、網(wǎng)絡(luò)化、智能化的不同階段圍繞前沿技術(shù)的部署應(yīng)用、邏輯機(jī)理、風(fēng)險(xiǎn)問題等形成了豐富的默會(huì)知識(shí);另一方面,社會(huì)公眾在數(shù)字法治轉(zhuǎn)型中也整體性、普遍性地提升了參與數(shù)字化司法活動(dòng)的技術(shù)素養(yǎng)與實(shí)踐知識(shí),在與法律人工智能的互動(dòng)中生成了關(guān)于其基本概念、應(yīng)用方式等方面的認(rèn)知。這些都為法律大模型的研發(fā)與應(yīng)用提供了充分的實(shí)踐經(jīng)驗(yàn)支持。
3. 法律領(lǐng)域組織資源稟賦
法律領(lǐng)域內(nèi)各類組織的組織需求與偏好、較強(qiáng)的組織結(jié)構(gòu)彈性與可塑性、圍繞技術(shù)應(yīng)用的組織間壓力和競爭共同形成了中國法律大模型的領(lǐng)域組織資源稟賦。這一資源稟賦決定了中國法律大模型的研發(fā)與應(yīng)用具有面向國家需求的全局動(dòng)員特征,也決定了中國法律大模型仍然在一定程度上延續(xù)地方試點(diǎn)主義和同儕競爭相結(jié)合的技術(shù)擴(kuò)散風(fēng)格。
其一,在組織需求與偏好方面,法律大模型在法律領(lǐng)域具有廣泛的應(yīng)用場景。智能技術(shù)應(yīng)用一直以來都承載了正向、積極且熱切的期望,并被視為中國式法治現(xiàn)代化的新道路、新動(dòng)能。政法機(jī)關(guān)不僅在應(yīng)對“訴訟爆炸”、強(qiáng)化配合制約、優(yōu)化職權(quán)配置、提升法律服務(wù)等方面對法律大模型具有現(xiàn)實(shí)的組織需求,其作為國家層面的政治法律組織共同體,還通過國家推進(jìn)主義與整體主義的組織行動(dòng)路徑,銜接法律大模型創(chuàng)新的舉國體制與領(lǐng)域?qū)嵺`,實(shí)現(xiàn)組織偏好的有效對齊。
其二,在組織結(jié)構(gòu)與彈性方面,政法機(jī)關(guān)通過內(nèi)部結(jié)構(gòu)的專門調(diào)整,為法律大模型的引入提供了有力的組織支持。從自適應(yīng)結(jié)構(gòu)化理論來看,法律組織既為法律大模型提供應(yīng)用場景,也通過自身內(nèi)部結(jié)構(gòu)的自我調(diào)適實(shí)現(xiàn)對法律大模型的自適應(yīng)使用。在國家層面,最高人民法院、最高人民檢察院先后成立了人民法院信息技術(shù)服務(wù)中心、數(shù)字檢察工作領(lǐng)導(dǎo)小組等內(nèi)設(shè)機(jī)構(gòu)或協(xié)調(diào)機(jī)構(gòu),有效提升了應(yīng)對智能化建設(shè)任務(wù)復(fù)雜性的組織結(jié)構(gòu)彈性。在地方層面,各級(jí)政法機(jī)關(guān)也根據(jù)地方實(shí)際優(yōu)化組織內(nèi)部的機(jī)構(gòu)設(shè)置與職權(quán)配置,組建技術(shù)處、信息處等專門管理應(yīng)用法律科技的內(nèi)設(shè)部門來統(tǒng)籌信息化智能化建設(shè)??偟膩碚f,這些專門機(jī)構(gòu)一方面具有規(guī)模上的彈性,在平常狀態(tài)下,負(fù)責(zé)組織內(nèi)部技術(shù)應(yīng)用的評(píng)估、保障等日常性工作,在涉及法律科技應(yīng)用的重大專項(xiàng)時(shí)也能夠迅速組織大量人力物力資源;另一方面具有權(quán)責(zé)上的彈性,所負(fù)責(zé)的內(nèi)容以技術(shù)為核心,能夠覆蓋組織內(nèi)的各個(gè)業(yè)務(wù)領(lǐng)域,并有效服務(wù)于管理法律大模型的復(fù)雜性需求。
其三,在組織壓力與競爭方面,中國法律大模型有望在技術(shù)與組織的密切互動(dòng)中獲得多維、多層的組織資源支持。作為“任務(wù)”的法律智能化改革催生了政法機(jī)關(guān)間的“同形”,即組織基于服從由權(quán)威產(chǎn)生的正式或者非正式壓力而導(dǎo)致的組織趨同。無論是數(shù)字法院建設(shè)還是數(shù)字檢察改革,乃至整個(gè)政法領(lǐng)域智能化改革,前沿技術(shù)的應(yīng)用普遍遵循國家推動(dòng)、頂層設(shè)計(jì)、官方主導(dǎo)的總體布局,并依托科層制下的“命令—服從”“目標(biāo)—考核”機(jī)制自上而下地分解為工作任務(wù)得以實(shí)現(xiàn)。這種壓力使得法律組織迅速適應(yīng)前沿技術(shù)的變革,通過大量“一線”探索創(chuàng)新來回應(yīng)社會(huì)對組織正當(dāng)性的需求。隨著法律大模型被納入頂層推動(dòng)下的數(shù)字法治建設(shè)任務(wù)序列,組織間基于對技術(shù)應(yīng)用本身以及完成技術(shù)應(yīng)用任務(wù)的共同需求,形成一種“強(qiáng)制同形”壓力。與此同時(shí),由于頂層支持的風(fēng)向標(biāo)與指揮棒效應(yīng),不同地域、層級(jí)、類型的法律組織圍繞前沿人工智能技術(shù)的應(yīng)用展開激烈的同儕競爭。法律大模型作為最前沿的法律人工智能技術(shù)之一,對其的研發(fā)應(yīng)用符合智能化建設(shè)推陳出新的總體要求。受此影響,不同組織就會(huì)逐步在結(jié)構(gòu)和實(shí)踐上進(jìn)行轉(zhuǎn)變,并最終在“模仿同形”的組織行動(dòng)中擴(kuò)散對于法律大模型的組織偏好。
4. 法律領(lǐng)域制度資源稟賦
作為中國式法治現(xiàn)代化的重要名片,數(shù)字法治的理論與實(shí)踐在近年來取得飛速發(fā)展。良好的制度準(zhǔn)備被視作中國數(shù)字法治建設(shè)的重要優(yōu)勢?!蛾P(guān)于充分運(yùn)用智能化手段推進(jìn)政法系統(tǒng)頑瘴痼疾常治長效的指導(dǎo)意見》、《最高人民法院關(guān)于加快建設(shè)智慧法院的意見》(法發(fā)〔2017〕12號(hào))、《人民法院信息化建設(shè)五年發(fā)展規(guī)劃(2019—2023)》(法〔2019〕79號(hào))、《檢察大數(shù)據(jù)行動(dòng)指南(2017—2020年)》、《司法部關(guān)于進(jìn)一步加強(qiáng)司法行政信息化建設(shè)的意見》等規(guī)范性文件中明確了全面推進(jìn)法律領(lǐng)域圍繞大數(shù)據(jù)與人工智能技術(shù)進(jìn)行科技創(chuàng)新的重要政策導(dǎo)向。2024年12月26日,最高人民法院發(fā)布的《人民法院第六個(gè)五年改革綱要(2024—2028年)》(以下簡稱《六五綱要》)明確提出,強(qiáng)化大語言模型技術(shù)應(yīng)用。以一系列“中華人民共和國法院行業(yè)標(biāo)準(zhǔn)”為代表的領(lǐng)域行業(yè)標(biāo)準(zhǔn)為法律大數(shù)據(jù)與人工智能的研發(fā)提供了全面的指引。政法機(jī)關(guān)還探索了法律大模型應(yīng)用的倫理規(guī)范,如《最高人民法院關(guān)于規(guī)范和加強(qiáng)人工智能司法應(yīng)用的意見》(法發(fā)〔2022〕33號(hào))就關(guān)注了法律人工智能可能產(chǎn)生的倫理道德風(fēng)險(xiǎn)。不容忽視的還包括各類行業(yè)自律規(guī)范,如智慧司法技術(shù)總師系統(tǒng)、浙江大學(xué)、上海交通大學(xué)、阿里云計(jì)算有限公司、科大訊飛研究院聯(lián)合發(fā)布的《法律大模型評(píng)估指標(biāo)和測評(píng)方法(征求意見稿)》也在產(chǎn)學(xué)研用共同體層面塑造法律大模型的研發(fā)與應(yīng)用。
5. 法律領(lǐng)域符號(hào)資源稟賦
受數(shù)字法治建設(shè)的知識(shí)啟蒙,中國社會(huì)對于以大數(shù)據(jù)與人工智能為代表的法律科技保有較高的知悉度和認(rèn)可度,認(rèn)為其對于司法公正、司法權(quán)威、司法效率與司法便民均有顯著的正面效應(yīng)。有調(diào)查顯示,近90%的中國公眾表示有興趣使用機(jī)器預(yù)測他們法律糾紛的結(jié)果,87.7%的受訪者認(rèn)為引入大數(shù)據(jù)和機(jī)器學(xué)習(xí)將提高法律結(jié)果的確定性。從深層邏輯來看,法律領(lǐng)域作為社會(huì)治理的重要實(shí)踐面向,受到實(shí)用主義的影響,對技術(shù)適用秉持開放態(tài)度,這極大拓展了人工智能在法律領(lǐng)域適用的深度與廣度,為法律大模型的創(chuàng)新與發(fā)展創(chuàng)設(shè)了更為寬松的認(rèn)知環(huán)境。同時(shí),在法律領(lǐng)域積極運(yùn)用法律大模型往往是特定機(jī)關(guān)積極跟進(jìn)時(shí)代、推動(dòng)改革的重要表征,能夠?yàn)檎C(jī)關(guān)獲得足夠的符號(hào)資源。與中國官方積極助推的態(tài)度不同,域外對法律大模型的態(tài)度較為保守。以美國為例,只有9%的受訪者認(rèn)為應(yīng)該在法庭環(huán)境中使用生成式人工智能;有93%的受訪者表示其目前并未使用并且在可預(yù)見的階段也不會(huì)安裝人工智能技術(shù)系統(tǒng)。
(二)中國法律大模型的法律領(lǐng)域資源困境
中國法律領(lǐng)域資源稟賦盡管為中國法律大模型的研發(fā)與應(yīng)用提供了技術(shù)動(dòng)力,但需正視的是,法律領(lǐng)域在數(shù)據(jù)準(zhǔn)備、知識(shí)儲(chǔ)備、組織基礎(chǔ)、政策環(huán)境、認(rèn)知傳統(tǒng)等方向面臨的多維資源困境,正對法律大模型的領(lǐng)域塑造形成系統(tǒng)性的制約與挑戰(zhàn)。
1. 法律領(lǐng)域數(shù)據(jù)資源困境
雖然當(dāng)前中國有著巨量數(shù)據(jù)資源,但法律語料的總體比重極低,高質(zhì)量法律語料更加有限。法律大模型所需要的法律領(lǐng)域數(shù)據(jù)資源存在可獲性和可用性雙重困境。
法律大模型數(shù)據(jù)資源的可獲性是指獲取法律文本數(shù)據(jù)的機(jī)會(huì)和可能性,主要涉及能否通過公開的數(shù)據(jù)庫或者渠道獲取法律大模型訓(xùn)練所需的法律文本數(shù)據(jù)。雖然中國通過數(shù)字法治建設(shè)乃至整個(gè)數(shù)字中國建設(shè)實(shí)現(xiàn)了海量法律文本的數(shù)字化,但是法律大模型仍面臨著多種數(shù)據(jù)資源可獲性困境。
在法律法規(guī)方面,當(dāng)前我國高質(zhì)量法律法規(guī)數(shù)據(jù)庫主要由若干大型法律類商業(yè)平臺(tái)控制,免費(fèi)開放型法律法規(guī)庫的數(shù)量、規(guī)模與法律大模型的開發(fā)要求不完全匹配。在法律文書方面,掌握大量法律文書材料的政法機(jī)關(guān)之間存在不同程度的數(shù)據(jù)壁壘,數(shù)據(jù)孤島情況嚴(yán)重;部分地區(qū)政法機(jī)關(guān)尤其是部分基層政法機(jī)關(guān)的卷宗電子化歸檔、數(shù)字化流轉(zhuǎn)等基礎(chǔ)的信息化任務(wù)還未完成;此外,存量豐富的電子合同因涉及大量的個(gè)人隱私與商業(yè)秘密,難以大規(guī)模地開放使用。在法學(xué)學(xué)術(shù)文獻(xiàn)方面,海量論文主要被收錄于商業(yè)數(shù)據(jù)庫,難以開放獲取。 法律大模型數(shù)據(jù)資源的可用性指法律文本數(shù)據(jù)能否被有效應(yīng)用于法律大模型的預(yù)訓(xùn)練,主要涉及數(shù)據(jù)的質(zhì)量、格式、結(jié)構(gòu)化程度等。法律行業(yè)作為一個(gè)具有濃厚職業(yè)化、專業(yè)化色彩的行業(yè),領(lǐng)域數(shù)據(jù)對于來源、識(shí)別、表達(dá)、傳播的規(guī)范性要求較高。實(shí)踐中,部分法律領(lǐng)域語料,如網(wǎng)絡(luò)問答等公開語料雖然具有較強(qiáng)的通用性與較大的數(shù)據(jù)體量,但是數(shù)據(jù)質(zhì)量難以保證,隱含較大的偏差甚至錯(cuò)誤風(fēng)險(xiǎn)。此外,雖然當(dāng)前大語言模型基座訓(xùn)練時(shí)愈發(fā)強(qiáng)調(diào)無監(jiān)督或者自監(jiān)督學(xué)習(xí),但在開發(fā)法律大模型時(shí)仍需要基于海量法律領(lǐng)域數(shù)據(jù)對通用大模型基座進(jìn)行微調(diào)以提升法律領(lǐng)域任務(wù)的表現(xiàn)?!拔⒄{(diào)”在中文語境具有一定誤導(dǎo)性?!拔ⅰ蓖ǔ1徽J(rèn)為與較低工作量對應(yīng)。實(shí)際上,微調(diào)分為局部微調(diào)和全局微調(diào)??紤]到法律大模型與通用大模型在源數(shù)據(jù)和目標(biāo)任務(wù)上有較大差異,需要進(jìn)行大比例甚至是全局意義上的“微調(diào)”,包括對模型的所有參數(shù)進(jìn)行重新訓(xùn)練和優(yōu)化,從而適應(yīng)法律領(lǐng)域的需求。在此過程中,涉及大量精標(biāo)的法律領(lǐng)域數(shù)據(jù),比如標(biāo)注法律因果關(guān)系鏈、責(zé)任歸屬推導(dǎo)邏輯鏈、案件爭議焦點(diǎn)與法律依據(jù)等,這對法律職業(yè)群體的有效參與和知識(shí)嵌入提出了較高要求。因?yàn)榉晌谋局蟹尚g(shù)語的復(fù)雜性、法律規(guī)范的變動(dòng)性、法律淵源的多樣性、法律知識(shí)的地方性、法律認(rèn)知的具身性、法律表述的差異性等,法律語料的標(biāo)注需要具有專門法律知識(shí)的法律從業(yè)者花費(fèi)大量的時(shí)間進(jìn)行。這便制約了法律文本數(shù)據(jù)的高質(zhì)量結(jié)構(gòu)化處理,產(chǎn)生了法律大模型訓(xùn)練中法律語料的可用性困境。
2. 法律領(lǐng)域知識(shí)資源困境
法律大模型作為垂域大模型,不僅依賴與通用大模型共通的基礎(chǔ)算法等知識(shí)底座,更需要場景化研發(fā)、工程化落地的法律領(lǐng)域技術(shù)知識(shí)。截至2025年4月,國家互聯(lián)網(wǎng)信息辦公室公布的已備案的340余項(xiàng)生成式人工智能服務(wù)中僅有寥寥數(shù)項(xiàng)法律大模型。這凸顯了現(xiàn)有基于通用模型領(lǐng)域微調(diào)的法律大模型技術(shù)范式在應(yīng)對法律領(lǐng)域高精度需求、細(xì)粒度理解、復(fù)雜邏輯推理、長法律文本處理等專有需求方面的顯性知識(shí)困境。首先是模型訓(xùn)練環(huán)節(jié)的困境。中國的法律規(guī)范體系具有高度復(fù)雜性,轉(zhuǎn)致規(guī)定、特別規(guī)定、例外規(guī)定乃至法條競合、法律沖突不同程度存在,因此,盡管法律大模型以大量法律法規(guī)文本作為基礎(chǔ)訓(xùn)練語料,但作為基于模式識(shí)別的人工智能,還無法完全理解法律體系的層次結(jié)構(gòu)、競合關(guān)系和規(guī)范沖突。同時(shí),由于包括法律法規(guī)在內(nèi)的法律文本以大量專業(yè)化、特定化的法律術(shù)語、法律概念為基礎(chǔ),盡管法律大模型通過法律文本訓(xùn)練能夠在一定程度上捕捉到法言法語與日常用語的差別,也能在一定程度上識(shí)別法言法語背后的語言模型,但仍然無法完全理解不同法律用語在不同法律文本中的細(xì)微區(qū)別。其次是結(jié)果輸出環(huán)節(jié)的困境。為避免知識(shí)幻覺出現(xiàn),法律領(lǐng)域要求法律大模型提供的信息是可驗(yàn)證的,具有權(quán)威來源的支持。常見的技術(shù)框架有大小模型協(xié)同、知識(shí)增強(qiáng)、檢索增強(qiáng)等。以檢索增強(qiáng)(RAG)為例,該技術(shù)旨在確保法律大模型不僅可以提供答案,還可以指向答案來源的超鏈接。在RAG框架下,模型在回答問題或生成文本時(shí)能夠從廣闊的專門數(shù)據(jù)庫中尋找相關(guān)信息,從而提高回答的準(zhǔn)確度。但RAG技術(shù)在信息檢索時(shí),向量表示可能無法識(shí)別復(fù)雜法律用語之間的細(xì)微差別,進(jìn)而造成概念混淆、答非所問??傊?,法律大模型的知識(shí)滯后以及知識(shí)幻覺等問題雖然可以通過采用RAG技術(shù)提供外接知識(shí)庫的方法在一定程度上得到緩解,但現(xiàn)有技術(shù)仍無法從根本上解決這一問題。
此外,雖然近年來中國的數(shù)字法治建設(shè)在整個(gè)社會(huì)形成了法律業(yè)務(wù)數(shù)字化轉(zhuǎn)型的積極氛圍,但法律職業(yè)群體在關(guān)于法律大模型的諸多默會(huì)知識(shí)方面仍有所欠缺,主要體現(xiàn)在:一是技術(shù)認(rèn)知素養(yǎng)不足。中國通用大語言模型的商業(yè)化部署處于起步期,相當(dāng)部分法律大模型也處于開發(fā)試驗(yàn)階段。因此,目前中國社會(huì)對于法律大模型的技術(shù)機(jī)理及其在法律領(lǐng)域的典型應(yīng)用場景等基本問題的認(rèn)知仍較為不足。二是法律提示素養(yǎng)不足。精準(zhǔn)的提示可以引導(dǎo)法律大模型更加接近提問者的詢問意圖,并生成更符合期待的內(nèi)容。目前部分法律人在綜合運(yùn)用法律指令提示、法律角色提示、法律案例提示、法律條文提示等默會(huì)知識(shí)方面的經(jīng)驗(yàn)不足,導(dǎo)致法律提示的準(zhǔn)確性、層次性、有效性與完備性仍有較大提升空間。三是信息辨識(shí)素養(yǎng)不足。法律大模型的技術(shù)邏輯決定了其不可避免地出現(xiàn)知識(shí)幻覺,因此需要法律職業(yè)群體準(zhǔn)確辨識(shí)生成內(nèi)容的準(zhǔn)確性并避免被錯(cuò)誤信息誤導(dǎo)或操縱。上述信息辨識(shí)素養(yǎng)的獲得和提升,仍需要長期應(yīng)用的經(jīng)驗(yàn)積累。四是風(fēng)險(xiǎn)規(guī)避素養(yǎng)不足。在法律大模型的自我學(xué)習(xí)進(jìn)化機(jī)制下,應(yīng)用者在利用其進(jìn)行法律問答、案例分析的過程中可能產(chǎn)生個(gè)人隱私、商業(yè)秘密、國家機(jī)密的泄露風(fēng)險(xiǎn)。面對上述風(fēng)險(xiǎn)所應(yīng)具備的風(fēng)險(xiǎn)規(guī)避素養(yǎng),也有賴于關(guān)于法律大模型技術(shù)認(rèn)知、應(yīng)用方法、信息分辨等默會(huì)知識(shí)的整體積淀。
3. 法律領(lǐng)域組織資源困境
在智能化建設(shè)的“同形”壓力下,法律組織圍繞法律科技進(jìn)行攀比式競爭,法律領(lǐng)域部分智能技術(shù)的研發(fā)、部署與應(yīng)用呈現(xiàn)出內(nèi)卷化的態(tài)勢,甚至出現(xiàn)了以人工智能為噱頭而實(shí)際上只是經(jīng)過包裝的傳統(tǒng)技術(shù)的偽智能。由此也就導(dǎo)致了“實(shí)踐中真正有用并投入常態(tài)化運(yùn)營的法律人工智能系統(tǒng)并不普遍”。這種實(shí)效性不足在一定程度上影響了以政法機(jī)關(guān)為代表的法律組織對于法律大模型的熱情,使其在面對法律大模型時(shí)更加審慎?!读寰V要》明確提及的“加強(qiáng)對人工智能司法應(yīng)用的審查監(jiān)管和風(fēng)險(xiǎn)評(píng)估”就體現(xiàn)出了最高人民法院對于前沿法律人工智能技術(shù)的研發(fā)部署應(yīng)用將采取更慎重、更穩(wěn)健的態(tài)度。此外,由于在組織屬性、利益關(guān)切、財(cái)力物力等方面存在差別,不同政法機(jī)關(guān)推進(jìn)法律大模型研發(fā)應(yīng)用過程中的自發(fā)性、自覺性以及最終的建設(shè)成果存在顯著差異。中國人口龐大、地域遼闊、國情復(fù)雜的特征也決定了在同一政法機(jī)關(guān)系統(tǒng)內(nèi)部,不同層級(jí)特別是不同區(qū)域的數(shù)字化、網(wǎng)絡(luò)化與智能化水平也存在很大差異。政法機(jī)關(guān)智能化水平的不均衡影響了法律大模型在法律組織間的技術(shù)擴(kuò)散。不容忽視的還在于,作為法律共同體的律師事務(wù)所相對游離于法律人工智能的應(yīng)用之外,可能整體上對法律大模型的應(yīng)用需求與部署意愿不夠強(qiáng)烈。因?yàn)槁蓭熓聞?wù)所具有社會(huì)性、市場化法律組織的原子化屬性,單個(gè)律師事務(wù)所通常無法負(fù)擔(dān)法律大模型開發(fā)應(yīng)用的高昂成本,相對松散的組織間關(guān)系也難以通過組織整合與組織動(dòng)員凝聚合力共同展開法律大模型的部署應(yīng)用。
4. 法律領(lǐng)域制度資源困境
現(xiàn)有法律制度尚未有針對性地就生成式人工智能在法律領(lǐng)域的應(yīng)用進(jìn)行全方位的規(guī)劃與指引,整體呈現(xiàn)出激勵(lì)不足、約束缺位的雙重制度性困境。這導(dǎo)致法律大模型研發(fā)缺乏專項(xiàng)的政策扶持與財(cái)政保障,降低了市場主體的政策預(yù)期,并削弱了其投入研發(fā)的意愿。同時(shí),法律大模型在性能指標(biāo)、測試方案、部署標(biāo)準(zhǔn)等方面缺乏統(tǒng)一標(biāo)準(zhǔn),致使市場主體因?yàn)樾畔⒈趬尽①Y源錯(cuò)配及協(xié)同機(jī)制缺失等市場失靈現(xiàn)象而陷入不公平、不充分與不透明的競爭格局。例如,差異化的組織需求和監(jiān)管標(biāo)準(zhǔn)可能增加“一院一策”的負(fù)擔(dān),顯著抬升市場主體的交易成本。此外,我國法律領(lǐng)域尚未針對生成式人工智能的應(yīng)用出臺(tái)專門的倫理準(zhǔn)則與安全規(guī)范,不僅導(dǎo)致無法對法律大模型的多重?cái)?shù)據(jù)安全、倫理、隱私風(fēng)險(xiǎn)進(jìn)行有效識(shí)別與防控,還使得對如何把握法律大模型的應(yīng)用邊界缺乏可操作性的行為指引。
5. 法律領(lǐng)域符號(hào)資源困境
法律大模型面臨的多種知識(shí)幻覺影響了法律職業(yè)群體和社會(huì)公眾對法律大模型的信任度。通過加強(qiáng)專業(yè)性與準(zhǔn)確性消除知識(shí)幻覺固然重要,但就文化認(rèn)知層面的符號(hào)資源而言,準(zhǔn)確度與信任度之間并非充分必要關(guān)系。對于法律領(lǐng)域而言,法律職業(yè)群體、社會(huì)公眾對于法律大模型的信任還可能和算法的可解釋性與透明度相關(guān)聯(lián)。算法可解釋性強(qiáng)調(diào)算法能夠“以人類可理解的語言向人類展示算法系統(tǒng)為何作出特定預(yù)測或決策的方法”。盡管在法律大模型的訓(xùn)練過程中增加了與法律人的價(jià)值對齊,但其底層邏輯仍然呈現(xiàn)非線性學(xué)習(xí)特性(如數(shù)據(jù)驅(qū)動(dòng)的增量效應(yīng)),這就導(dǎo)致法律大模型算法決策路徑仍然難以追溯。此外,普通用戶缺乏分析和評(píng)估機(jī)器學(xué)習(xí)算法執(zhí)行的復(fù)雜操作結(jié)果的專業(yè)知識(shí),認(rèn)知上的局限可能導(dǎo)致即使技術(shù)上有所突破也難以實(shí)現(xiàn)有效解釋。盡管現(xiàn)有法律大模型可以在有效互動(dòng)中為用戶提供分析過程的形式解釋,但此種形式可解釋性背后仍然是基于統(tǒng)計(jì)上的相關(guān)性而非真正的因果關(guān)系,本質(zhì)是以復(fù)雜的方式按照算法和概率將輸入映射到輸出、剪切和粘貼文本。簡言之,法律大模型可能導(dǎo)致的知識(shí)幻覺與實(shí)質(zhì)性解釋能力缺失的風(fēng)險(xiǎn)在一定程度上阻礙了以用戶認(rèn)可與信任為基礎(chǔ)的符號(hào)資源的充分獲取。
四、面向能動(dòng)塑造中國法律大模型的法律領(lǐng)域資源優(yōu)化
在推動(dòng)中國法律大模型創(chuàng)新與應(yīng)用時(shí),不應(yīng)單純圍繞技術(shù)談技術(shù),而應(yīng)將法律領(lǐng)域放置到能動(dòng)塑造的關(guān)鍵位置,從協(xié)同和簡化兩個(gè)維度構(gòu)建破解法律領(lǐng)域資源困境的改革方案。一方面,需要明確法律領(lǐng)域能動(dòng)塑造中國法律大模型的總體目標(biāo),協(xié)同領(lǐng)域內(nèi)多層次意圖,形成目的性干預(yù)、反思性調(diào)控、策略性選擇的一致性集體行動(dòng);另一方面,需要簡化法律領(lǐng)域內(nèi)各資源之間的復(fù)雜互動(dòng)關(guān)系,形成具有可操作性的數(shù)據(jù)、知識(shí)、組織、制度和符號(hào)資源的有效供給機(jī)制。
(一)以推動(dòng)中國法律大模型自主創(chuàng)新為總體目標(biāo)
在中國式法治現(xiàn)代化建設(shè)的背景下,應(yīng)將推動(dòng)中國法律大模型自主創(chuàng)新作為法律領(lǐng)域資源系統(tǒng)優(yōu)化的總體目標(biāo),自上而下統(tǒng)合法律領(lǐng)域各類資源的生產(chǎn)與供給,從而形成具有縱向?qū)R性與橫向一致性的系統(tǒng)性資源供給。要通過“集聚法律界和科技界力量進(jìn)行原創(chuàng)性引領(lǐng)性科技攻關(guān),突破法治領(lǐng)域科技發(fā)展的各種卡脖子難題,確立起中國在世界法治科技發(fā)展上的領(lǐng)跑地位”。這不僅要求在每類資源的生產(chǎn)與供給過程中主動(dòng)創(chuàng)造條件與中國法律大模型創(chuàng)新的目標(biāo)對齊,還要求法律領(lǐng)域的多元資源形成合力,共同向支撐中國法律大模型自主創(chuàng)新的目標(biāo)聚集。
習(xí)近平總書記指出,要全面推進(jìn)人工智能科技創(chuàng)新、產(chǎn)業(yè)發(fā)展和賦能應(yīng)用,完善人工智能監(jiān)管體制機(jī)制,牢牢掌握人工智能發(fā)展和治理主動(dòng)權(quán)。在此背景下,中國法律大模型的自主創(chuàng)新需要圍繞關(guān)鍵技術(shù)、應(yīng)用場景、標(biāo)準(zhǔn)規(guī)范、行業(yè)生態(tài)、安全保障等方面的自主與可控展開。具體而言,關(guān)鍵技術(shù)自主可控要求中國法律大模型的數(shù)據(jù)處理、價(jià)值對齊、領(lǐng)域微調(diào)、算力支持等關(guān)鍵技術(shù)獨(dú)立發(fā)展,保障算法與模型架構(gòu)自主、數(shù)據(jù)資源可獲可控;應(yīng)用場景自主拓展強(qiáng)調(diào)面向中國法律領(lǐng)域的真實(shí)需求,在無需依賴外部技術(shù)的基礎(chǔ)上,持續(xù)探索法律大模型的場景化應(yīng)用,是領(lǐng)域需求與技術(shù)能力深度耦合的產(chǎn)物;規(guī)范標(biāo)準(zhǔn)自主制定是指中國法律大模型的規(guī)范標(biāo)準(zhǔn)應(yīng)以本土需求為關(guān)照,聚焦發(fā)展的主動(dòng)權(quán)和國際話語權(quán);行業(yè)生態(tài)自主建構(gòu)的目標(biāo)在于推動(dòng)中國法律大模型從技術(shù)到應(yīng)用、從硬件到軟件、從研發(fā)到商業(yè)化全鏈路生態(tài)的自主建構(gòu);安全自主保障關(guān)注中國法律大模型研發(fā)、部署和應(yīng)用全生命周期安全保障技術(shù)與制度的自主化。
以中國法律大模型的領(lǐng)域能動(dòng)塑造理論為關(guān)照,中國法律大模型的自主創(chuàng)新意味著依靠我國的科技力量全面掌握與法律大模型相關(guān)的數(shù)據(jù)資源、知識(shí)資源、組織資源、制度資源與符號(hào)資源,從而自主推進(jìn)法律大模型技術(shù)的突破性進(jìn)展,有效支撐中國式法治現(xiàn)代化建設(shè)。其中,數(shù)據(jù)資源和知識(shí)資源在很大程度上決定了中國法律大模型能否實(shí)現(xiàn)關(guān)鍵技術(shù)的自主可控;組織資源是中國法律大模型應(yīng)用場景自主拓展的關(guān)鍵所在;制度資源是標(biāo)準(zhǔn)規(guī)范自主制定、安全自主保障的基礎(chǔ)和前提;數(shù)據(jù)資源、知識(shí)資源、組織資源、制度資源和符號(hào)資源共同支撐了中國法律大模型行業(yè)生態(tài)的自主構(gòu)建。
(二)法律領(lǐng)域復(fù)雜資源系統(tǒng)的簡化機(jī)制
法律領(lǐng)域是一個(gè)典型的復(fù)雜資源系統(tǒng),其構(gòu)成要素以非簡單方式進(jìn)行直接或間接的相互作用。其中,符號(hào)資源與制度資源既受其他資源影響,又決定了其他資源的生產(chǎn)、供給與配置。比如,對法律大模型的高度認(rèn)可意味著更多的組織支持和場景應(yīng)用,制度資源則可以決定數(shù)據(jù)資源的獲取和使用方式。組織資源既在符號(hào)資源與制度資源的框架下運(yùn)作,又通過組織運(yùn)作實(shí)踐與反饋而調(diào)整制度資源與符號(hào)資源。數(shù)據(jù)資源、知識(shí)資源的稟賦深受制度資源的影響,其面臨的困境亦可以直接或間接推動(dòng)制度資源的優(yōu)化。數(shù)據(jù)資源與知識(shí)資源之間也存在復(fù)雜的互動(dòng)關(guān)系。比如,法律從業(yè)人員的技術(shù)素養(yǎng)影響對數(shù)據(jù)資源的生產(chǎn)和運(yùn)用;法律從業(yè)人員參與數(shù)據(jù)資源的生產(chǎn)不僅影響模型的開發(fā),還通過反饋?zhàn)饔糜谥R(shí)資源,推動(dòng)法律從業(yè)人員的技術(shù)素養(yǎng)提升。
若在法律領(lǐng)域資源系統(tǒng)優(yōu)化的過程中充分考慮各資源之間的互動(dòng)關(guān)系,將使得資源供給策略變得過于復(fù)雜而失去可操作性。此時(shí),需要在層次系統(tǒng)理論的指導(dǎo)下實(shí)現(xiàn)對領(lǐng)域資源系統(tǒng)復(fù)雜動(dòng)態(tài)交互的有效簡化。層次系統(tǒng)理論認(rèn)為,大規(guī)模系統(tǒng)通常面臨復(fù)雜性的問題,而將系統(tǒng)分解為層次化的子系統(tǒng)是復(fù)雜性系統(tǒng)最為核心的簡化機(jī)制;在復(fù)雜系統(tǒng)的層次架構(gòu)中,高層次單元定義任務(wù)并協(xié)調(diào)較低級(jí)別的單元;各層次單元通過協(xié)調(diào)機(jī)制保證局部目標(biāo)與全局目標(biāo)的一致性。受制于社會(huì)系統(tǒng)之間弱耦合形成的“近似可分解性”(near-decomposability),各子系統(tǒng)在專注實(shí)現(xiàn)自身最優(yōu)狀態(tài)的基礎(chǔ)上,主要與關(guān)系最為密切的直接上層或者下層子系統(tǒng)進(jìn)行交互與反饋。那種強(qiáng)調(diào)“萬物皆相互聯(lián)系”的全局交互理念在處理復(fù)雜問題時(shí)并無幫助,甚至可能會(huì)產(chǎn)生誤導(dǎo)。
在層次系統(tǒng)理論的框架下,可以基于功能層次將法律領(lǐng)域各類資源區(qū)分為宏觀、中觀與微觀三個(gè)層面。其中,宏觀層面主要包括作為整體意義上的符號(hào)資源與具有廣泛影響和基礎(chǔ)性作用制度資源。中觀層面是在認(rèn)知和宏觀制度基礎(chǔ)上相對更為具象的概念,主要包括組織資源以及部分延伸至中觀層面的制度資源。微觀層面與法律大模型的技術(shù)直接相關(guān),主要包括數(shù)據(jù)資源與知識(shí)資源。由此,法律領(lǐng)域復(fù)雜資源系統(tǒng)的優(yōu)化問題就可以被簡化為:宏觀層面的符號(hào)、制度資源確定領(lǐng)域資源系統(tǒng)的戰(zhàn)略性、全局性、認(rèn)知性、制度性框架,并影響中觀層面和微觀層面領(lǐng)域資源的生產(chǎn)與供給。盡管宏觀與微觀資源之間存在直接交互可能,但為了避免各層次資源全面交互帶來的高度復(fù)雜性,在化約整體方案時(shí),宏觀、中觀、微觀三個(gè)層面的領(lǐng)域資源主要與關(guān)系最為密切的上層或者下層領(lǐng)域資源互動(dòng)。在此過程中,應(yīng)以中觀層面的組織資源為中心,其通過銜接微觀層面與宏觀層面實(shí)現(xiàn)資源之間的流動(dòng)與交換,確保整個(gè)領(lǐng)域資源系統(tǒng)圍繞推動(dòng)中國法律大模型自主創(chuàng)新的總體目標(biāo)展開。
選擇以組織資源為中心系出于理論、歷史與現(xiàn)實(shí)三方面的原因。其一,從理論上看,復(fù)雜系統(tǒng)需要一個(gè)控制中心或協(xié)調(diào)節(jié)點(diǎn),以確保各子系統(tǒng)高效運(yùn)行。在法律領(lǐng)域的復(fù)雜資源系統(tǒng)中,組織往往是資源整合的關(guān)鍵節(jié)點(diǎn)。它是直接作用于其他資源的調(diào)度器,通過規(guī)劃和整合能力對數(shù)據(jù)、知識(shí)、制度和符號(hào)資源進(jìn)行有效配置和優(yōu)化。一方面,組織資源協(xié)調(diào)微觀層面數(shù)據(jù)資源與知識(shí)資源的生產(chǎn),參與宏觀層面制度資源與符號(hào)資源的建構(gòu),并承接制度資源與符號(hào)資源的宏觀目標(biāo)指引。另一方面,組織資源作為居中的節(jié)點(diǎn)還承擔(dān)反饋與調(diào)控的功能,可以匯聚數(shù)據(jù)與知識(shí)資源的反饋(如強(qiáng)化數(shù)據(jù)資源供給的建議)作為調(diào)整制度資源的依據(jù),以及以制度和符號(hào)資源設(shè)定的目標(biāo)為指引調(diào)節(jié)數(shù)據(jù)和知識(shí)資源的具體生產(chǎn)。以組織為中心的資源供給機(jī)制既避免了脫離總體目標(biāo)的碎片化、多方向的領(lǐng)域資源供給格局,又將領(lǐng)域資源系統(tǒng)復(fù)雜的資源互動(dòng)與耦合關(guān)系簡化為可操作的管理機(jī)制。其二,從歷史維度看,自工業(yè)革命以降,組織始終既是技術(shù)研發(fā)和應(yīng)用的重要場景,又是技術(shù)創(chuàng)新的關(guān)鍵推動(dòng)者。技術(shù)創(chuàng)新往往通過“系統(tǒng)組裝”實(shí)現(xiàn),而系統(tǒng)組裝的關(guān)鍵在于組織資源的整合能力。其三,立基于中國法律大模型發(fā)展的現(xiàn)實(shí)背景,我國法律科技的改革長期以來奉行地方試點(diǎn)主義與同儕競爭相結(jié)合的路徑,這使得組織層面的政法機(jī)關(guān)一直是我國法律科技研發(fā)與應(yīng)用最為核心的推動(dòng)力量。
(三)法律領(lǐng)域資源供給的優(yōu)化方案 在優(yōu)化數(shù)據(jù)資源供給層面,以政法機(jī)關(guān)為代表的法律組織需要通過法律數(shù)據(jù)的開放與共享以及法律數(shù)據(jù)的標(biāo)準(zhǔn)化等舉措有效回應(yīng)數(shù)據(jù)可獲性與可用性的困境,從而形成高質(zhì)量、廣泛覆蓋的自主法律數(shù)據(jù)生態(tài)系統(tǒng)。2023年新一輪機(jī)構(gòu)改革中正式組建的國家數(shù)據(jù)局為法律大模型數(shù)據(jù)資源的優(yōu)化供給提供了組織基礎(chǔ)。當(dāng)務(wù)之急,是由國家數(shù)據(jù)局牽頭、各政法機(jī)關(guān)數(shù)據(jù)管理部門配合,形成“合作型數(shù)據(jù)治理格局”,共同推動(dòng)構(gòu)建法律數(shù)據(jù)的分級(jí)標(biāo)準(zhǔn),將政法機(jī)關(guān)數(shù)據(jù)劃分公開數(shù)據(jù)、受限數(shù)據(jù)、敏感數(shù)據(jù)、涉密數(shù)據(jù)四大類。其中,公開數(shù)據(jù)為可向社會(huì)公眾完全開放的政法數(shù)據(jù),如已公開判決書、法律法規(guī)等;受限數(shù)據(jù)為不涉密但需控制知悉范圍的政法數(shù)據(jù),如案件流程數(shù)據(jù);敏感數(shù)據(jù)包括當(dāng)事人身份信息等政法數(shù)據(jù);涉密數(shù)據(jù)則為涉及國家安全、重大公共利益的政法數(shù)據(jù)。在此基礎(chǔ)上,應(yīng)明確全生命周期的法律數(shù)據(jù)分級(jí)管控措施:對于公開數(shù)據(jù),可以開放下載或?qū)β?lián)合開發(fā)的授權(quán)主體提供API接口;對于受限數(shù)據(jù),應(yīng)允許在簽訂保密協(xié)議的基礎(chǔ)上,在內(nèi)網(wǎng)環(huán)境部署數(shù)據(jù)沙箱進(jìn)行法律大模型訓(xùn)練,但原始受限數(shù)據(jù)全程不能離開政法機(jī)關(guān)服務(wù)器;對于敏感數(shù)據(jù),除了遵循受限數(shù)據(jù)相同的方案外,還需要在訓(xùn)練前進(jìn)行強(qiáng)脫敏處理,并且所有輸出結(jié)果均須經(jīng)過差分隱私審核,確保無法反推個(gè)體信息;對于涉密數(shù)據(jù),則禁止任何意義上的對外共享。此外,可在“數(shù)據(jù)二十條”推動(dòng)行業(yè)性數(shù)據(jù)流通使用的要求下,探索法律行業(yè)數(shù)據(jù)交易平臺(tái)與國家級(jí)數(shù)據(jù)交易場所的互聯(lián)互通,提供法律領(lǐng)域數(shù)據(jù)資源交易的良性環(huán)境。對于法律領(lǐng)域數(shù)據(jù)資源的可用性困境,法律組織可以搭建法律大模型研發(fā)的分布式參與機(jī)制,將法律大模型研發(fā)的任務(wù)分解為可以順便完成的小任務(wù),嵌入到法律職業(yè)群體的日常業(yè)務(wù)流程,并允許法律職業(yè)群體在碎片化時(shí)間內(nèi)以靈活的方式生產(chǎn)結(jié)構(gòu)化領(lǐng)域數(shù)據(jù)資源,如在使用智能法律輔助系統(tǒng)時(shí),允許法律職業(yè)群體隨手對生成內(nèi)容進(jìn)行“點(diǎn)贊”或“糾錯(cuò)”。在此基礎(chǔ)上,可在國家級(jí)法律數(shù)據(jù)資源庫的建設(shè)過程中階段性地推進(jìn)法律領(lǐng)域結(jié)構(gòu)化數(shù)據(jù)的供給,保障社會(huì)公開或市場可交易的法律數(shù)據(jù)資源的模型訓(xùn)練可用性。
在優(yōu)化知識(shí)資源供給層面,法律組織應(yīng)在法律大模型研發(fā)應(yīng)用的顯性知識(shí)與默會(huì)知識(shí)構(gòu)建過程中強(qiáng)化法律職業(yè)群體與法律科技群體之間的互動(dòng),形成國家層面自主的法律大模型核心技術(shù)優(yōu)勢。一方面,相較于通用大模型而言,法律大模型具有極高的專業(yè)性、準(zhǔn)確性與價(jià)值性需求,因此法律大模型訓(xùn)練研發(fā)的具體流程應(yīng)面向法律職業(yè)群體開放,引導(dǎo)法律人提煉有關(guān)法律領(lǐng)域價(jià)值的專家原則,協(xié)助構(gòu)建法律領(lǐng)域指令數(shù)據(jù)的微調(diào)標(biāo)準(zhǔn)和法律輸出的驗(yàn)證標(biāo)準(zhǔn),通過引入法律職業(yè)群體的專業(yè)能力來彌補(bǔ)法律技術(shù)群體對法律規(guī)范體系和具體法律判斷的顯性知識(shí)缺陷。例如,用于實(shí)現(xiàn)法律大模型檢索增強(qiáng)的法律知識(shí)庫必然包括大量高質(zhì)量法律知識(shí)及其來源,需要法律職業(yè)群體的合力建構(gòu)。考慮到當(dāng)前法律職業(yè)群體以顯性知識(shí)對法律大模型研發(fā)的參與度有限,法律組織應(yīng)優(yōu)化體制機(jī)制為法律職業(yè)群體參與法律大模型的價(jià)值對齊、指令微調(diào)、輸出驗(yàn)證提供正向激勵(lì)和流程便利,從而為領(lǐng)域顯性技術(shù)知識(shí)的優(yōu)化提供專業(yè)支撐。另一方面,法律組織應(yīng)在培訓(xùn)機(jī)制中充分發(fā)揮法律科技群體對于法律職業(yè)群體技術(shù)素養(yǎng)提升中的作用,針對技術(shù)認(rèn)知素養(yǎng)、法律提示素養(yǎng)、信息辨識(shí)素養(yǎng)、風(fēng)險(xiǎn)規(guī)避素養(yǎng)等默會(huì)知識(shí)展開有針對性的、成體系的查漏補(bǔ)缺。
在優(yōu)化組織資源供給層面,以政法機(jī)關(guān)為代表的法律組織也應(yīng)作為系統(tǒng)內(nèi)部層次不斷地自我優(yōu)化,在強(qiáng)化與其他領(lǐng)域資源層次溝通的同時(shí)克服自身內(nèi)部的資源困境。其一,政法機(jī)關(guān)應(yīng)調(diào)適組織偏好,以更加務(wù)實(shí)和審慎的態(tài)度參與構(gòu)建并應(yīng)用真正實(shí)用的法律大模型系統(tǒng),尤其要避免以大模型為噱頭造勢而忽視其實(shí)效的應(yīng)用。當(dāng)然,審慎與務(wù)實(shí)絕非意味著對法律前沿科技的態(tài)度由“來者不拒”到“因噎廢食”。這就要求調(diào)整組織結(jié)構(gòu),建立一套以實(shí)用性和適配性為核心的法律大模型的事前評(píng)估機(jī)制,重點(diǎn)關(guān)注技術(shù)能否真實(shí)解決法律場景的業(yè)務(wù)痛點(diǎn)。政法機(jī)關(guān)不應(yīng)過多沖到推動(dòng)法律大模型在內(nèi)的法律前沿科技突破性創(chuàng)新的“第一線”,而更應(yīng)該為具有一定成熟度的法律大模型提供應(yīng)用場景。在事前評(píng)估中,尤其要利用法律職業(yè)群體熟悉的案件場景(如民事糾紛或刑事審判)構(gòu)建模擬場景,從而更加準(zhǔn)確地測試法律大模型的具體應(yīng)用效果。與此同時(shí),法律組織還應(yīng)當(dāng)建立法律大模型適用后的動(dòng)態(tài)評(píng)估與持續(xù)跟蹤機(jī)制,并基于法律職業(yè)群體的有效反饋而推動(dòng)法律大模型的迭代優(yōu)化。其二,以律師事務(wù)所為代表的法律服務(wù)機(jī)構(gòu)應(yīng)逐漸成為法律大模型推廣與應(yīng)用的關(guān)鍵主體。實(shí)際上,隨著技術(shù)的加速演進(jìn),法律大模型可以與法律人形成良好的人機(jī)協(xié)同關(guān)系,為全面提升法律服務(wù)的數(shù)量、質(zhì)量與可及性帶來可能。因此,處于市場商業(yè)競爭環(huán)境中的律師事務(wù)所等更應(yīng)充分發(fā)揮法律大模型的賦能作用,以人機(jī)協(xié)同的高質(zhì)量法律服務(wù)在市場競爭中取得優(yōu)勢;組織規(guī)模更大的法律服務(wù)機(jī)構(gòu)(如大型律所)可與科技公司合作,積極參與法律大模型的訓(xùn)練研發(fā)。從結(jié)果上看,法律組織資源的自我優(yōu)化最終應(yīng)實(shí)現(xiàn)法律大模型應(yīng)用場景的自主擴(kuò)展。
在優(yōu)化制度資源供給層面,法律組織也是形成法律大模型政策指引、行業(yè)標(biāo)準(zhǔn)、安全規(guī)范與倫理規(guī)范等的核心力量,這些制度資源的生產(chǎn)和供給應(yīng)從激勵(lì)和約束兩個(gè)維度聚焦組織、制度與市場的有機(jī)協(xié)同,強(qiáng)化法律大模型的市場創(chuàng)新,并保障法律大模型的安全應(yīng)用。最高人民法院、最高人民檢察院、司法部等可以發(fā)布法律大模型的政策指引,通過設(shè)置領(lǐng)域需求來引導(dǎo)市場主體積極投入法律大模型研發(fā);加快編制法律大模型(可信可溯源)的行業(yè)標(biāo)準(zhǔn),明確性能指標(biāo)、測試方案、安全需求、接口標(biāo)準(zhǔn)、部署方案等核心內(nèi)容,為市場主體提供公平透明的競爭環(huán)境,避免過分強(qiáng)化組織資源而造成的權(quán)力尋租與市場扭曲的風(fēng)險(xiǎn);及時(shí)出臺(tái)法律大模型的倫理規(guī)范,構(gòu)建法律大模型的負(fù)面應(yīng)用清單,提示法律大模型使用過程中的潛在風(fēng)險(xiǎn),如國家機(jī)密、商業(yè)秘密與個(gè)人隱私的泄露等;指導(dǎo)法律職業(yè)群體識(shí)別可能由大模型生成的材料,并在法律組織內(nèi)部構(gòu)建法律職業(yè)群體負(fù)責(zé)任地使用法律大模型的正當(dāng)程序。
在優(yōu)化符號(hào)資源供給方面,法律組織應(yīng)積極構(gòu)建第三方算法測評(píng)與算法審計(jì)相結(jié)合的可信法律大模型雙重保障體系。其中,算法測評(píng)關(guān)注法律大模型的準(zhǔn)確性、穩(wěn)定性等技術(shù)指標(biāo),旨在量化評(píng)估法律大模型的“性能”與“效率”,是“技術(shù)導(dǎo)向”下消除法律知識(shí)幻覺的優(yōu)化工具;算法審計(jì)則重點(diǎn)圍繞“監(jiān)管”和“問責(zé)”展開,聚焦法律大模型的合法性、合倫理性、正當(dāng)性、透明性與可問責(zé)性,通過倫理測試、數(shù)據(jù)溯源、多方驗(yàn)證等方式確保法律大模型的“可信”與“可控”,是“治理導(dǎo)向”下提升可解釋性與透明度的優(yōu)化工具。算法測評(píng)與算法審計(jì)賦予法律組織有力的技術(shù)與治理工具,共同支撐了可信法律大模型的建設(shè),有利于提升社會(huì)公眾與法律職業(yè)群體對法律大模型的信任度,實(shí)現(xiàn)法律領(lǐng)域符號(hào)資源的高效生產(chǎn)。在此基礎(chǔ)上,法律組織在確保法律大模型核心參數(shù)、訓(xùn)練數(shù)據(jù)及其關(guān)鍵優(yōu)化細(xì)節(jié)安全的同時(shí),可探索推動(dòng)模型基本架構(gòu)、算法原理、模塊劃分、推理代碼、評(píng)估數(shù)據(jù)集、測試用例等內(nèi)容的有限開源,允許獨(dú)立第三方對法律大模型進(jìn)行架構(gòu)復(fù)現(xiàn)并展開驗(yàn)證,但不能直接使用完整的法律大模型。更進(jìn)一步,法律組織應(yīng)積極搭建“開放性參與”的機(jī)制,吸收法律職業(yè)群體與社會(huì)公眾的有效參與,打造可公開、可解釋、可救濟(jì)的法律大模型。同時(shí),針對不同受眾采取個(gè)性化的解釋方式,從而最大化提升公眾對法律大模型的信任度。
五、結(jié) 語
隨著法律大模型的加速迭代,其掀起的智能浪潮可能對法律領(lǐng)域帶來重塑性影響。因此,法律大模型的發(fā)展絕非單純意義的技術(shù)工具,而是關(guān)乎中國式法治現(xiàn)代化未來演進(jìn)方向的重要命題。在此浪潮中,法律領(lǐng)域行動(dòng)者不能止步于做法律大模型的技術(shù)應(yīng)用者——擁抱技術(shù)固然重要,但這仍是技術(shù)決定論意義上的被動(dòng)回應(yīng)與消極防御。相反,法律領(lǐng)域行動(dòng)者應(yīng)以價(jià)值守門人、知識(shí)生產(chǎn)者、制度供給者等多重身份,能動(dòng)介入法律大語言模型的進(jìn)化與演進(jìn),塑造符合中國式法治現(xiàn)代化需求的法律大模型技術(shù)風(fēng)格。這勢必是一個(gè)長期、漸進(jìn)的,需要大家共同參與、體驗(yàn)和創(chuàng)造的時(shí)代進(jìn)程。盡管本文以法律大模型為關(guān)注點(diǎn),但領(lǐng)域塑造理論的本質(zhì)是研究法律領(lǐng)域的復(fù)雜資源網(wǎng)絡(luò)如何影響法律科技,因此同樣適用于其他技術(shù)與法律領(lǐng)域的互動(dòng)分析。從更廣的維度看,強(qiáng)調(diào)法律領(lǐng)域?qū)Ψ纱竽P偷乃茉熳饔?,意味著技術(shù)發(fā)展并非基于純粹的技術(shù)邏輯,還可以從優(yōu)化中國法律領(lǐng)域的資源條件入手,為形成我國法律科技的自主創(chuàng)新優(yōu)勢提供理論資源,并與“高水平科技自立自強(qiáng)”的國家戰(zhàn)略形成對話。