XXX_Loop_XXX |
Только что в новостях смотрел про прогу, которая определяет процент "заимствования" из инет рефератов и т.п. Интересно, а как она работает, т.е. каков принцип действия? Был на их сайте, но ничего интересующего не нашёл. |
tetro |
Не знаю как это фигня будет работать, но тривиальные заимствования можно вполне на каком-нибудь перле с гуглом сваять... В цикле на 10к попыток Вычисляем случайный инкремент из поданного реферата и ищем повторение предложения длиной скажем 10-15 слов подряд в И-те. Если нашли начинаем сравнивать детально окрестности повторения в оригинальном документе и в тех что нашли... Другой метод: (приемлем для более специфичных областей) сделать рейтиг повторения слов в реферате и И-те найти те которые в реферате встречаются заметно чаще чем в И-те и для документов с похожей статистикой искать ... |
-=Велла=- |
Таким образом получается, что для работы рограммы нужен Инет? А если нету? |
tetro |
Еще раз - я без понятия о какой программе речь... Я написал пару идей что бы я сделал если бы мне надо было такое сделать ... 2 -=Велла=- : по сути вопроса - я мало верю в возможность пути отличного от поиска источников. (Если передо мной 2 статьи по теме в __которой__ я__ни__бельмеса__ - мне достаточно тяжело решить кто откуда списал). Поэтому кстати есть бизнес по написанию рефератов на заказ. |
XXX_Loop_XXX |
Зайдите Сюда и всё увидите. Интересно как она получает доступ к ресурсам где пароль представлен ввиде картинки? |
tetro |
Давайте, так я регистрироваться у них не буду, а то что есть на титульной странице на человеческий язык не переводится ... Если вы можете дать ссылки на детальную информацию, то мы о ней поговорим. Картинку прочитать может не только человек, но и машина если очень надо. Да и обходные пути при случае есть. А куда вам это надо? |
XXX_Loop_XXX |
Вэлла, проверяемый реферат загружается на сайт и потом идёт проверка.... Подобная проверка уже стала обязательной в МГУ и планируется ввести её во всех ВУЗах России. Просто интересно как она работает, думаю скоро появится нечто такое из ПО, которая будет "обрабатывать" реферат и он будет "правильно" оценён этой прогой. :) |
tetro |
Повторюсь: кроме случаев "примитивного" списывания я не верю в эффективность автоматических систем (и это я говорю как доктор наук в области неслишком далекой области). С другой стороны: я за пару минут личного чтения реферата в области которую я знаю скажу откуда его скомпилировали... |
-=Велла=- |
Наверное работает по подобию антиспамовских фильтров.. Учится, то есть... ФИгня все это, препод и сам знает, когда кто-то откуда-то списал... Это по стилю письма видно... |
tetro |
Не может такая фигня учиться ... ибо нет у нее тренера, который скажет что списано а что нет. Плюс или ее надо тренировать на каждого в отдельности, так как предположим вы ей сунули цельно тянутый реферат (который скажем написал вам знакомый) как он узнает что автор не вы, а тот знакомый. А если этот знакомый не знакомый, а известный в узких кругах источник. Что можно попытаться это построить стилистический анализатор текста, но я не слышал о работающих прототипах... |
Абвгдейка |
да фигня это все. у них даже пушкин не входит в документ. хотя задумка интересная)) |
XXX_Loop_XXX |
ты проверял? |
По моему, это самый верный вариант связать прогу с любым поисковиком и, соответственно, искать идущие друг за другом слова на повтор. А если эти слова поменять местами или заменить синонимами, то, по моему, прога будет бессильно, что либо сделать. |