
1.Програми та сервіси: "Порівняння тексту"
Навіщо порівнювати тексти:
• Порівняння документів потрібно, коли у вас маса текстів і публікацій, в які Ви періодично вносите правки і, ось так сталося, що не пам'ятаєте - який з варіантів дійсно вірний;
• Порівняння на схожість тексту потрібно, коли Ваш (і тільки Ваш) документ вже опублікований і ви наштовхується на дуже схожий, ніби переказаний іншими словами - і тоді можна визначити - Ваш цей текст, із внесеними змінами, або просто так склалося;
• Або навпаки, Ви змінили текст і необхідно перевірити чи достатньо внесених правок, щоб якісно відрізнятися від оригіналу (і не уславитися плагіатором)
• Виявлення змін у Ваших текстах корисно тоді, коли необхідно дізнатися, які і де зміни були зроблені в тексті, і в якій версії файлу вони зроблені правильно, а в який ні.
Власне кажучи про цілі - все. Переходимо до методів досягнення цих цілей.
Онлайн-сервіс «TopWriter β - сам собі рерайтер!»
Система призначена редакторам, рерайтерам і копірайтетам для допомоги в підготовці тексту або виявленні текстів-плагіатом. Самостійно використання системи дозволить значно заощадити час. Топрайтер працює цілодобово і дозволяє безкоштовно обробляти великі обсяги тексту по 5000 знаків за раз; аналіз більш вагомих фрагментів тексту треба оплачувати, хоча й зовсім невеликий, але все ж грошиками ..
Тестувався на власних текстах, а також і на необхідних для роботи чужих. У всіх випадках, відсоток зазначеної схожості був цілком вірним. Але конкретних фрагментів матеріалу з ідентичністю змісту сервіс не вказує. Тим не менш, при простому аналізі на «одне чи це і теж» чудово можна зробити порівняння і, що важливо, зробити це миттєво.
У цьому ж сервісі працює і синонімайзер - програма для перетворення початкового тексту в інший за змістом ідентичний, але зовні змінений, за допомогою баз словникових синонімів. Цей сервіс уже - платний. Мені він і не потрібно, а ось комусь - може і стане в нагоді. До речі сервісів-сінонімайзери - в інтернеті можна знайти скільки завгодно велику кількість. На всіх мовах, платних і безкоштовних, великих і маленьких ... але - не про них мова. А про їх, у тому числі, розпізнають, так сказати, контрагентів.
Shingles Expert v.1.1 (freeware)
Shingles Expert Pro (19wmz)
Якийсь 27-річний російський програміст Олег написав програму для порівняння текстів чи статей методом шинглів (Shingles) - Shingles Expert v.1.1, через свою простоту і точності вказується схожості стала досить популярною. Є думка, що на основі цього методу або більше грубого (супершінгла) пошуковики оцінюють унікальність контенту. Програма безкоштовна, без обмежень. Є три кнопки, основна з яких «Порівняти». Більш функціональну версію можна скачати з офсайта, попередньо заплативши Олегу 19wmz.
У порівнянні з відомими аналогами у Shingles Expert є важливі переваги. Перше - нормалізація (емуляція) всього тексту, в якій відкидаються закінчення слів, щоб відсікти зміни слів при відмінюванні, відмінюванні і т.п. Якість визначення схожості збільшується до 5-15%. Хоча за рахунок грубості методу, можуть бути й деякі неточності, але тільки в бік підвищення строгості перевірки. Друге - відкидання стоп-слів. Метод знижує навантаження при розрахунку порівняння, відкидаючи поширені союзи, прийменники. Дозволяє обійти деякі найпростіші синонімічні зміни. При невеликому обсязі тексту - відсоток збігів знижується, тому що відкидається часто схожа частину тексту. Ось це ось не зовсім ясно, в плюс воно чи ні. Безкоштовна версія - за цим посиланням.
Онлайн-сервіс FindCopy
Чудовий і ефективний онлайн-сервіс FindCopy. Після проведеного порівняння, показує не тільки відсоток схожості, але й на прикладі першого тексту ті фрагменти, де присутні зміни в самому його написанні. Так само як і попередня програма використовує метод шинглів. Дозволяє знаходити запозичення з максимально високою точністю. FindCopy здатний виявити плагіат не тільки при ручному перевірці, але і в повністю автоматичному режимі із заданою частотою.
Природно, що такий сервіс бути благодійним не може. Безкоштовна перевірка здійснюється не частіше одного разу на дві хвилини, а при виведенні знайдених результатів виводиться не більше п'яти позицій. Тим не менш, безкоштовна перевірка на FindCopy - це швидкий і простий спосіб оцінити унікальність тексту. Якщо вам потрібні більш детальні дані, то необхідно авторизуватися в системі та проводити перевірку вже у своєму акаунті, витрачаючи близько 0,02 $ за разову, але необмежену за обсягом тексту, перевірку.
У сервісі FindCopy автоматичний режим перевірки - це пошук, засобами сервісу, в мережі незаконних копій вашого тексту. FindCopy буде самостійно шукати плагіат і повідомляти вас про їх виявленні. Перевірка здійснюється постійно з вказаної вами періодичністю.
Cognitive Text Analyzer від Cognitive Technologies
Справжній професійно-експертний продукт для визначення оригінальності текстів створила російська компанія Cognitive Technologies - це система автоматичного аналізу та порівняння текстів Cognitive Text Analyzer.
Програма проводить синтаксичний, семантичний і структурний розбір і аналіз тексту російською або англійською мовами, усуває синтаксичні та семантичні неоднозначності і виявляє близько сотні характеристик даного тексту. Точна кількість характеристик залежить від обсягу тексту і різноманітності конструкцій, що зустрічаються усередині нього. Швидкість розбору тексту на сучасному офісному комп'ютері становить 450-500 сторінок тексту в хвилину.
Система може і використовується не тільки в порівнянні статей і підтвердження авторських прав, але і при реєстрації патентів і в криміналістиці і на даний момент є продуктом, якого з нетерпінням чекають у комерційній версії.
Комбайн-програма Compare Suite
Compare Suite - програма не тільки для виявлення схожості в тексті, а й для порівняння файлів і папок. За допомогою цієї програми можливо порівняння таких типів файлів, як Adobe PDF, файлів Word, Excel, веб-сторінок ... Крім класичного, посимвольного, методу порівняння Compare Suite підтримує порівняння за словами і за ключовими словами.
Compare Suite - зовсім не типовий інструмент для порівняння, тому що він може бути використаний для різних типів порівняння - посимвольного, пословного і за ключовими словами. Одне з головних відмінностей в тому, що він дозволяє використовувати різні методи порівняння. Тому Ви завжди може дізнатися, в якому аспекті файли схожі, а в якому - відмінні.
Вагоме доповнення: остання версія програми вміє порівнювати також графічні та звукові файли, що безумовно стане в нагоді, якщо у вас величезну кількість фотоматеріалів або клипартов, або велика колекція муз-записів. Програма, до речі, реалізує і порівняння файлів в архівах і, навіть, коду в бінарних файлах.
Compare Suite випускається у вигляді стандартної і професійної версії. Стандартна версія дає користувачам можливості, описані вище. Професійна версія додатково підтримує елементи необхідні для порівняння файлів і папок розташованих на FTP, дає можливість створення коментарів до файлів і документів, роблячи зручною, наприклад, спільну роботу над копірайтингом в команді.
Серйозним недоліком Compare Suite є його занадто висока ціна: $ 70 за стандартну і $ 140 за про-версію. Але, для того щоб відчути все переваги Compare Suite, розробники дають можливість протягом цілого місяця користуватися без обмежень повнофункціональної стандартною версією, яку можна завантажити з цієї офіційної посиланням.