如果有人以某種方式生成單詞頻率列表。例如,通過分析Web語料庫或來自鍵盤的數據。這種形式的單詞表及其頻率是否受版權保護?例如,如果有人選擇在線發布此列表,是否可以使用版權法對其進行保護?
編輯:單詞頻率列表是單詞列表及其在文本中出現的次數。
編輯2:對於感興趣的人來說,司法權屬於印度,但儘管我不介意世界各地的一般信息,因為它對所有人都有幫助。
如果有人以某種方式生成單詞頻率列表。例如,通過分析Web語料庫或來自鍵盤的數據。這種形式的單詞表及其頻率是否受版權保護?例如,如果有人選擇在線發布此列表,是否可以使用版權法對其進行保護?
編輯:單詞頻率列表是單詞列表及其在文本中出現的次數。
編輯2:對於感興趣的人來說,司法權屬於印度,但儘管我不介意世界各地的一般信息,因為它對所有人都有幫助。
基礎文本可能受版權保護,但單個詞卻不受保護-它們通常是語言中獨立存在的詞(有些發明的詞如“ chrowl”我從未見過出現在單詞頻率列表中)。頻率計數只是有關語料庫中語言使用的事實報告。即使在允許對事實數據庫提供某種保護的歐盟中,詞頻列表的嚴格客觀性也排除了版權保護,請參見數據庫指令 Art。 3:
根據本指令,由於其內容的選擇或排列而構成作者自己的智力創造的數據庫,應受版權保護。
- ol>
本指令所規定的數據庫的版權保護不得擴展至其內容,並且不得影響任何權利。
原始內容受保護的是單詞的創造性組合,但頻率列表中卻沒有。
僅通過眉毛或更典型地通過計算機程序來創建單詞表。作為數據庫,它缺少版權保護所必需的最低限度的創造力。創建頻率計數的程序將受到保護,因為它涉及一些創造力,但是這種計算的結果卻並非如此-它是自動的。
數據不具有版權,但數據庫(結構化,組織化的數據)可能具有版權。這取決於管轄權,例如數據庫權利在歐盟得到承認。版權保護創意表達,而數據庫版權保護收集和組織數據的工作。
請注意,即使應用數據庫版權,也不會阻止其他人執行相同的分析並提出建議。
除了整個數據庫的權利外,還存在數據庫中各個條目的版權問題。例如,即使是幾個單詞的簡短文本片段也可能已經受到版權保護。但是,可以肯定地說單個單詞是無版權的,也許是“ Supercalifragilisticexpialidocious”之類的創造性單詞除外。根據管轄權的不同,可能不需要該材料。版權法對於科學用途或非商業性合理使用可能有例外,甚至可能認為這種使用在總體上完全沒有問題。
請注意,即使應用了數據庫權限,也不會阻止其他人執行相同的分析並提出等效的數據庫。
我認為Anon可以提供很好的幫助關於這個問題的建議,我唯一要做出的改變就是參考上述內容。
就版權(與專利不同)的本質而言,獨立創作不能成為對現有作品的補充。就是說,如果我在不參考其他作品的情況下創作了一個旋律,並且該旋律恰好與現有作品相同,那麼我的旋律就不會侵犯其他作品。
關於這樣的問題,例如什麼時候可能“暴露”於另一作品或無意識地複制它。
您設想的場景可能是其中創建方法是受保護的元素而不是創作的情況之一。本身。這使版權更接近專利的概念。在這種情況下,這可能意味著您對為完成分析而編寫的軟件具有版權保護,但對於該分析的輸出則沒有版權保護。
是的。在歐盟建立的任何數據庫中,肯定都有版權。詞頻列表是一個數據庫,擁有15年的特殊版權。這還包括派生作品。
輕輕地將單詞表計數重新混合為派生作品,並受版權保護。
“ user6726”提供的答案不完整。雖然可以生成自動頻率列表,但它們通常容易出錯。原始數據也許不能被版權保護,對此我不確定。
但是,經過清理的語料庫是受版權保護的。標記原始語料庫數據時,任何自動文本中的準確性都在35%到5%之間。這取決於所使用的軟件。這需要人工操作,並且要花費大量時間才能建立可靠的頻率列表。
尤其是斯拉夫語,因為它們有很多變形,所以很難。
我無法評論帖子,但另一個用戶說了一些有關使用相同源文本建立頻率列表的信息。多次使用某個源極不可能。通過分析源文本獲得的頻率列表會根據所使用的源文本而有很大差異。
如果有人使用了頻率列表,並且您有一定的經驗,那麼很容易發現他們沒有建立自己的頻率建立語料庫/頻率列表。
請在此處查看更多信息:
https://en.wikipedia.org/wiki/Database_right
來源:我是專門從事這類事情的出版商。
我會說“不”。基於單詞頻率列表不是創造性的作品。任何人都可以隨時生成該列表,甚至不必以相同的方式生成。它更多是一份實證研究出版物。因此,從定義上講,應該是可以測試的……正是通過讓其他人重複實驗(包括方法學)並產生大致相似的結果。研究是...我不知道版權是否是正確的用語,但當然您必須在應得的地方給予信譽。但是,數據本身不能享有版權。專利法既不實質性地不獨特,不對創新有所貢獻,也不適合市場銷售,也不適用,甚至單詞表中也沒有明顯的組成部分。所有這些相同的單詞已經在字典中列出了……早於這項研究。唯一真正的區別是它們的書寫順序,該順序僅基於可測量的數量(世界上普遍存在的數量),任何人都可以執行且沒有真正的創造力。