無断転載やコピペ、安易なリライト・・・
これらの行為を発見・防止できるコピペチェックツールは、Webメディアの編集者やライターにとって必須のツールです。
コピペチェックツールはWeb上の膨大なデータを解析することで、目視では見抜くのが困難な巧妙なリライト(いろいろな記事の文章を切り貼りする方法など)も発見します。
チェックにかかる手間はほとんどなく、テキストを貼り付けたりファイルをアップロードしたりして、チェックボタンをクリック。あとは、解析が終わるのを待つだけです。
この記事では、おすすめのコピペチェックツールを4つご紹介します。
無料で使えるツールもあるので、「とりあえず、どんな性能か試したい」という方もぜひ参考にしてください。
なぜコピペチェックをおこなうのか?
コピペチェックをおこなう目的は、おもに以下の2つです。
- 雑なリライトやパクリを発見・防止するため
- 自社サイトの記事の重複を発見するため
それぞれ、解説していきます。
雑なリライトやコピペを発見・防止するため
コピペチェックツールを使う最大の目的は、雑なリライトやコピペを発見・防止するためです。
コンテンツマーケティングやオウンドメディアという概念の普及で、多くの企業や個人がメディアを持つようになりました。それに伴って、記事を作成するWebライターも増えることに。ここで問題になったのが、Webライターのコピペ行為です。
多くの場合、Webライターは依頼主から企画案と参考記事のURLを渡されますが、安易なライターは、参考記事に書かれている内容の「言い回し」「構成」を少し変えただけで、そのまま使ってしまうのです。いわゆる「リライト(という名のパクリ)」です。
もっとひどいと、言い回しや表現の調整すらせずに、まるごとコピペするケースもあります。
コピペは論外として、言い回しを微妙に変えただけのリライトはグレー、というよりブラックな行為です。リライト元・コピペ元の記事の運営者から訴えられて、損害賠償請求に発展する可能性もあります。
また、金銭的な損害が発生しなくても、Googleからペナルティが課される可能性、社会的信用を失う可能性もあり、安易なリライト記事をアップすることには大きなリスクを伴います。
コピペチェックツールを使えば、そのような雑なリライトやコピペを一瞬で発見できます。リスクヘッジの手段として役立つでしょう。たいした手間もなく、訴訟リスクを回避できます。
自社サイトの記事の重複を発見するため
コピペチェックツールのもう一つの使い方として、自社サイトの記事の重複をチェックする方法があります。
長い間サイトを運営していると、同じような内容の記事が増えてしまいがちです。記事間で、内容や文言が少し被っているくらいは問題ありませんが、「この2つの記事、ほとんど内容同じだよな・・・」という場合は、重複コンテンツ扱いになるかもしれません。
コンテンツが重複していると、検索エンジンからの評価が分散して、思うように検索順位が上がらないことが多いです。運用歴の長い大規模なサイトほど、コンテンツ重複の影響は大きく、トラフィックが伸びない大きな原因であることも。
コピペチェックツールでは、解析対象範囲のドメインを指定できるものもあるので、自社サイトの記事との重複も簡単にチェックできます。
また、ファイル間の重複チェックも可能なツールなら、外注に依頼した30記事間の重複をチェックする、という使い方もできます。
おすすめのコピペチェックツール4選
ここからは、おすすめのコピペチェックツールを4つ、ご紹介します。
CopyContentDetector
無料コピペチェックツール【CopyContentDetector】
『CopyContentDetector』は、高機能ながら無料で使えるコピペチェックツールです。
テキストを貼り付けて(25文字から4,000文字)、「チェックする」 をクリックするだけ。1000文字くらいの文章なら、60秒~120秒ほどで解析完了します。
こちらが解析結果です。以下の2つの指標を見れば、コピペの深刻度を把握できます。
- 類似度判定:Webにある文章とどれくらい類似しているか? という指標
- 一致率判定 :Webにある文章と完全一致している率の指標
緑色で「良好」 と出れば、まず問題はありません。赤色で「コピーの疑い」と出たらコピペが疑われるので、「詳細表示」 をクリックして確認しましょう。
赤色の完全一致(文章が一言一句同じ)が多ければ、確信犯的なコピペだといえます。
CopyContentDetectorの機能詳細
料金 | 無料 ※有料プランもあり 詳細:有料プランで利用できる機能について |
文字数制限 | 25文字から4,000文字まで ※有料プランは8,000文字まで |
コピーチェックの回数制限 | 無制限 |
解析対象範囲のドメイン指定 | 有料プランのみ可能 |
対応しているファイル形式 | 無料ユーザー登録後、CSV一括登録とテキスト(.txt)一括登録を利用可 有料プランはWordファイル(.docx)も利用可 |
解析結果のダウンロード | CSVのダウンロード可能 |
公式サイト | https://ccd.cloud/ |
ちなみに、有料プランでは、WordPressのプラグイン「CopyContentDetector」が利用できます。このプラグインを使うと、WordPressの管理画面から簡単に記事のコピペチェックが実行できます。
こぴらん
『こぴらん』は、簡易的な無料コピペチェックツールです。
文章の類似度や一致率などの詳細なデータは取得できないので、巧妙なリライトを見つけるのは難しいですが、文章を丸ごとパクったコピペを見つけるだけなら、十分役立ちます。
コピペがなければ、類似数に「無」と表示されます。
完全一致のコピペがあると、その文章が使われているWebページの数が表示されるので、YahooかGoogleへのリンクを開いて、該当ページを確認しましょう。
こぴらんの機能詳細
料金 | 無料 |
文字数制限 | 25文字から4,000文字まで |
コピーチェックの回数制限 | 無制限 |
解析対象範囲のドメイン指定 | 不可 |
対応しているファイル形式 | テキストの貼り付けのみ |
解析結果のダウンロード | 不可 |
公式サイト | https://copyrun.net/ |
こぴらんはレスポンシブWebデザインが採用されているので、タブレットやスマホからも利用できます。普段は本格的なコピペチェックツールをパソコンで使って、外出時などパソコンが使えないときは、こぴらんで簡易的なチェックをする、といった使い分けもできそうです。
chiyo-co(旧サービス名“影武者”)
【chiyo-co】著作権保護・無断転載防止・コピペチェックツール
『chiyo-co』は、Webコンテンツの企画・制作をおもにおこなうCROCO株式会社が提供している、クラウド型のコピペチェックツールです。
解析結果の画面が非常に見やすく、直感的に理解できます。
このような形で、重複箇所があるWebページの一覧が表示されます。
詳細ページでは、検出されたWebページとの重複度を細かく確認できます。文章を簡単に比較できるので、利便性が非常に高いです。
料金プランについて
chiyo-coの無料プランでは、毎月10カウント※の解析ができます。
※chiyo-coにおけるカウントは、1000文字=1カウント換算です。たとえば1300文字の文章を解析すると、2カウントが消費されます。カウントは翌月に繰り越しできません。
また、重複(完全一致)だけでなく、類似度(言い回しを変えただけで内容が同じ)の解析もできますが、通常時の2倍のカウントを消費します。2000文字の文章であれば、4カウントです。
大量の文章をチェックするなら、有料プランへのアップグレードが必要になるでしょう。
料金 / 月(税込) | フリー(¥0) | プラン100(¥4,400) | プラン500(¥16,500) | プラン2000(¥55,000) |
解析カウント / ⽉ | 10 | 100 | 500 | 2000 |
CSVダウンロード | ☓ | ○ | ○ | ○ |
1解析あたりの 料金 |
0円 | 約44円 | 約33円 | 約27.5円 |
出典:【chiyo-co】著作権保護・無断転載防止・コピペチェックツール
chiyo-coの機能詳細
料金 | フリープランは無料 ※各種有料プランへのアップグレード可 |
文字数制限 | 5,000文字以上の文章は解析不可 |
コピーチェックの回数制限 | フリープランは10カウントまで ※1000文字の解析ごとに1カウント消費 有料プランへのアップグレードで、カウントを増やせる |
解析対象範囲のドメイン指定 | 可能 |
対応しているファイル形式 | xt / docx / xlsx / pptx / pdf形式に対応 |
解析結果のダウンロード | 可能 |
公式サイト | https://kagemusya.biz-samurai.com/ |
コピペリン
『コピペリン』 は、ダウンロード・インストール型の有料コピペチェックツールです。
検索回数、文字数ともに無制限。年間6,000円(月間500円)で使い放題。Web上のページとの重複チェックだけでなく、記事同士の重複チェックもできるので、外注ライターに大量に記事を依頼している場合に特に役立ちます。
ちなみに、OSはWindowsのみ対応しています(Macでは使えません)。
操作方法は、上でご紹介してきたツールと同じくシンプルで、文章をテキストで貼り付けるか、WordやExcelファイルをドラッグ&ドロップして、検索ボタンを押すだけ。簡単です。
このように、入力した文章(判定文章)とWebで見つかった類似文章(照合文章)を簡単に比較できます。
赤くなった箇所=コピペ、というわけでは必ずしもなく、あくまで「重複度が高いかも?」 というアラートです。たとえば文言が完全に同じ文章は下線付きで表示されますが、単語や用語、慣用句などは、どうやっても他サイトと重複するので、仕方ありません。
もちろん、長い文章が完全に一致していればコピペの可能性が高いので、削除するか文言を修正するか、どちらかの対応をしたほうがいいです。
コピペリンの機能詳細
料金 | 1ライセンス ¥6,000/年 1つのパソコンに対して1つのライセンス(シリアル番号)が発行されるので、導入するパソコンの台数ごとに1ライセンス購入が必要 |
文字数制限 | 無制限 |
コピーチェックの回数制限 | 無制限 |
解析対象範囲のドメイン指定 | 可能 |
対応しているファイル形式 | txt / csv / xlsx / xlsm / docs / docm / pptx / pptm / html / htm形式に対応 |
解析結果のダウンロード | 可能 |
公式サイト | https://saku-tools.info/copyperin/ |
コピペチェック時の判断基準「どこからがコピペ?」
コピペチェックをするときに迷うのが、「どこからどこまでがコピペなのか?」という判断ではないでしょうか?
ある程度の長さがある文章の言い回しや表現が完全に一致している場合は、わかりやすいのですが、そうでない場合は判断が難しいかもしれません。
重複度や類似率の指標はあくまで目安でしかない
「重複度や類似率が○○%を超えたらコピペ」という画一的な判断をすればいいと思うかもしれませんが、それらの数値は、あくまでツールがはじき出した目安でしかありません。
記事のテーマによっては、単語や用語が重複したり類似したりするのは避けられませんし、それらの単語や用語を削って記事を書くのも無理があります。
また、「このように」「しましょう」といった、当たり前に使われる言い回しも、ツールでは他記事との重複として検出されますが、だからといって「じゃあ、言い回しを修正しよう」というのもおかしな話です。
その程度の重複や類似は当然起こるものであり、重複度や類似率のパーセンテージが高いからコピペ、とは必ずしもいえません。Googleからペナルティを受けることはまずないですし、第三者から訴訟を起こされることもないでしょう。
完全オリジナルの文章など存在しない
大前提として、完全オリジナルの文章は存在しません。
同じような文章は、必ず、ほかのだれかが書いています。扱うテーマやトピック、使う単語や用語が被るのは避けられませんし、それをコピペといってしまうと、なにも書けなくなってしまいます。
もちろん、だれかの独自の主張やオリジナルのロジックを拝借して、それをあたかも自分が考えたかのように書くのはNGです(いわゆる、リライトという名のパクリ)。
しかし、ただの客観的な事実や一般論は、ほかの記事と内容が被っても問題ありません。
たとえば、ある法律の構成要件5つを書いて、それがほかの記事と被っていたとしましょう。この場合、法律の構成要件は、だれが書いても変わらないただの客観的な事実なので、著作権侵害でも盗作でもありません。
ここを理解していれば、Googleからのペナルティや第三者からの訴訟リスクを、過度に恐れる必要はないのです。
参考記事のリライト(という名のパクリ)はアウト
そもそも、普通に書いていれば、コピペで問題になることはまずないはずです。
ただ、参考記事を見ながら、言い回しが被らないようにちょこちょこリライトしただけの記事は、重複度や類似率が極端に高くなることがあります。
類似している記事のURLを確認したときに、ある特定のURLばかり表示されているようなら、そのURLの記事をパクって書いている可能性が高いです。記事を公開するのは止めたほうがいいでしょう。
公開するなら、類似記事と照らし合わせて、重複・類似している箇所を一つずつ修正していくしかありません。
とはいえ、それもなかなか面倒な作業です。そもそも論として、参考記事を見ながら言い回しだけを調整していくような、安易な方法で記事を書かない・書かせないほうが大事だと思います。
本来、コピペチェックツールは、あくまで「念の為かけておくか」 という程度の位置付けです。意図せず重複度や類似率が高い箇所があったら、少し手直しするくらいのもので、大幅な修正が発生するようなら、それは記事の作り方に深刻な問題があるということです。
端的に言ってしまえば、「リライト」 が前提の記事作りが、コピペ問題の大きな原因でしょう。参考記事の内容を検証することもなく、独自の価値を盛り込むこともなく、ただただ、効率よく文字数を稼いで記事を量産する手法です。
「リライト」といえば、コンテンツを作る時、外部ライターに記事の執筆依頼をする時など、よく耳にする単語ではないでしょうか。少し前にアフィリエイト界隈でブラックハットSEO(※)が流行していた頃から、よく聞くようになった単語であると思います。この記事では「リライト」は悪ということを言いたいのではありませ...
これでは必ずコピペ問題が起こります。だから、
- 自身の知見を加えること
- 新しい価値を持たせて共有すること
ということを意識することが大切です。自分の経験の蓄積が独自の視点や表現を生み出します。
独自の価値を記事にもたせることで、コピペのリスクは大きく下げられますし、Googleからも評価されやすくなります(Googleは独自性あるコンテンツを評価する)。
まとめ
最後に、この記事でご紹介したコピペチェックツールをまとめます(リンクをクリックで、各見出しに移動します)。
大量の記事をチェックする必要がなければ、無料で使えるCopyContentDetectorやこぴらんを、まずは試してみてはいかがでしょうか?
月に100本以上など、大量の記事をチェックする必要があれば、chiyo-coの有料プランやコピペリンの導入を検討することをオススメします。
ぜひ、目的に合ったツールを活用して、記事チェック作業を効率化してみてください。
コメント