Цифровое источниковедение - специфические проблемы - Михаил Елисейкин - читать книгу в онлайн-библиотеке

Цифровое источниковедение - специфические проблемы

5 553
Интернет позволяет историкам и другим исследователям получить доступ к множеству источников по теме. Однако, одновременно с этой возможностью, возникли и риски связанные с особенностями функционирования Интернета и цифровыми технологиями. В этой книге приведены примеры таких рисков и рекомендации по работе с цифровыми источникам.

Книга находится в процессе написания. Главы будут добавляться не в конец, а внутрь уже имеющейся структуры.
Впервые опубликовано
Добавили в библиотеку
26
Читают сейчас
16
Прочитали
3

Начало и конец дня на графике считаются по московскому времени (UTC +03:00)

Сортировать по

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

ShadowUser15
#

Спасибо! 

Проблема на самом деле огромная, и относится не только к истории - но и к науке/технологии в целом. 

Сейчас пишем "исторический труд" вида "много лет институту" - и столкнулись с проблемой что за последние 20 лет сложно найти даже фотки, не говоря уже о том кто чем занимался. Сложнее чем за 40 лет! Хотя и проще чем за 50-100 лет :) Слишком много людей ушло, слишком плохо с деньгами на нормальный сервер с СХД. Бэкап? Серверный - админ на свой личный диск, остальные - как повезёт...

 раскрыть ветвь  0
R.T.W.
#

Цифровой износ «с моего дивана» видится открытием автора, подтвержденным экспериментом.

Утрата черновых вариантов электронных документов в полном объёме «не лечится» ни бэкапами, ни контролем версий: автор написав слово может стереть его до сохранения. Разве что будут добросовестно пользоваться специальными программами, логирующими «каждый чих» (и тут надо будет решать проблему сохранности этих логов...).

Вероятность утраты цифрового источника можно снизить копированием на «нецифровой» носитель (привет от Мандиберга!).

Удаление антивирусом — лишний повод не пользоваться антивирусами, а просто соблюдать правила интернет-гигиены («пешеходной сетью» с переносом данных лентой-дискетой-диском-флешкой лично я уже давно не пользуюсь).

Не знаю как профессиональным историкам, а мне было интересно почитать про работу с цифровыми источниками.

 раскрыть ветвь  0
Валевич Георгий Владимирович
#

Неплохая подборка по путям изменения информации в электронном виде. Для тех кто не специалист по организации работы Интернет, но работает с текстом (и контентом в целом) может быть полезно.

 раскрыть ветвь  0
iit
#

В плане хранения истории изменений бэкапы точно не спасают. Однако есть и способ который может спасти положение и им давно уже пользуются сами разработчики.

В среднем внезапно 3 000 000 строк кода (видел и больше). И вот в пятницу вечером всплывает ошибка. Нужно за 10 минут среди этого всего найти одну строку, найти кто её сделал, когда и в контексте какой задачи.

Для этого отлично подходит система контроля версий, например я использую git. Во первых она хранит всю историю проекта, во вторых позволяет без особой боли посмотреть разницу между всеми правками (по крайней мере с текстом работает отлично, с остальным сложнее). И самое вкусное это возможность ветвления которое позволяет одновременно держать несколько параллельных историй версий что важно для коллективной работы.

Хранить можно локально, на своем сервере или в одном из сторонних вариантов (gitlab/github/bitbucket) у которых ограничения бесплатной версии только на размер проекта и количество людей имеющих доступ.

В общем если важно история то система контроля версий наше всё. Если ещё и производители софта бы интегрировались с ними то вообще было бы круто.

 раскрыть ветвь  1
Михаил Елисейкин автор
#

Как человек поднявший это тему, я с Вами согласен.

Но потом я мысленно переключаюсь на другую роль и обнаруживаю, что чистема хранения версий увеличивает размеры файлов. И это требует места на диске, а значит - это дополнительные денежные и организационные траты.

А ещё, оказывается, что в этой системе будет храниться тот кусок который я скопипастил из чужой книжки и потом попереставлял местами слова и позаменял синонимы. Получается, что я таким образом ещё и улики против себя собираю.

И это исходя из предположения о том, что данная система просто встроена в текстовый редактор и не требует дополнительных усилий по настройке и изучению.

В результате, я "писатель" спрашиваю себя "историка" о том зачем мне весь этот напряг и затраты?

И ответ в том, что для абсолютного большинства авторов это не нужно.
И даже тем кому это нужно, оно всё равно не нужно - в массовом софте этого не будет, а оно не настолько нужно, чтобы заморачиваться с каким-то специфическом решением и переставать быть совместимым с массовым софтом.

Вобщем, скорее всего, придётся будущим историкам обойтись без наших черновиков. :(

 раскрыть ветвь  0
Михаил Елисейкин автор
#
 раскрыть ветвь  0
Александр Архипов
#

Да, цифровые источники имеют свойства портится. Только что убедился:

 раскрыть ветвь  1
Михаил Елисейкин автор
#

Ого. Спасибо.

Это устойчивая проблема?

Иконка Redader View - режим включён или нет?

 раскрыть ветвь  0
Михаил Елисейкин автор
#

Добавлено "10 - Утрата переписок"

Надеюсь что завтра будут главы в разделе :)

 раскрыть ветвь  0
Михаил Елисейкин автор
#

Добавлен вводный текст к разделу "5 - Утрата вариантов"

 раскрыть ветвь  1
Михаил Елисейкин автор
#

залит "5.1 - Бэкапы не спасают"

 раскрыть ветвь  0
iit
#

Про поисковые системы справедливо! Заточка информации не для пользователей а для seo однозначно имеется.

Смысла в такой лапше минимум, мало того сейчас мы подходим к генерации текстов нейросетями и ии. 

Смысл в этих текстах может и есть но точно не для человека 😆 

 раскрыть ветвь  1
Михаил Елисейкин автор
#

Да.

А многим людям явление "seo-контента" непонятно.

Они в тих текстах выискивают ошибки, критикуют и т.п.

 раскрыть ветвь  0
Леонов Дмитрий
#

При всей оригинальности и логичности методологии автора не могу согласиться с одним моментом - лично мне неизвестен ни один случай удаления антивирусом текстового файла. Исключением может быть скрипт-вирус, но он является текстовым файлом формально - это не осмысленный текст с точки зрения простого человека.

К главе 2.1. "Дешёвый и бессмысленный контент" можно добавить, что во многих случаях подобный контент создаётся не человеком, а специальной программой - генератором контента. Чем и объясняется его бессмысленность.

Другой причиной бессмысленности контента является копирование оригинального контента, как правило, написанного интересно и по делу. Копируют его к себе на сайт для привлечения посетителей, часто без ведома правообладателя, в неполном или искажённом виде. Поэтому при использовании поисковых машин на один запрос может найтись множество ссылок на текст идентичного или схожего содержания. В этом случае важно найти первоисточник, что бывает непросто.

 раскрыть ветвь  16
Валевич Георгий Владимирович
#

 У моей подруги файл с дипломом удалил как-то антивирус.2004г.

 раскрыть ветвь  14
Михаил Елисейкин автор
#

Осмысленность - очень субъективный критерий.

Программы и серверные логи (в моём примере это именно они) так же могут быть историческими источниками имеющими смысл и ценность для исследователя.

А в случае с программами, это не только источник, а и способ работы с источников (но об этом будет другой пример)

> В этом случае важно найти первоисточник, что бывает непросто.

Да, это это большая проблема.

Невозможность найти и аттрибутировать исходный текст, узнать кто-когда-зачем его писал, задать уточняющие вопросы и пр - это проблема связанная со спецификой функционирования поисковых сервисов. И об этом, так же будет глава.

Тут, кстати, тоже весьма неоднозначно.

С одной стороны, у нас вроде бы как копия и эквивалент "списка". И существование копий это хорошо - многие тексты и изображения дошли до нас именно в виде копий. И какие-то вещи, я уже сейчас могу найти только в виде копий, ибо сайты источники либо перестали существовать, либо были переделаны и искомое не пережило процесса обновления сайта.

Но, с другой стороны - при "живом" исходном материале я не могу его найти и вынужден бродить по копиям.

Это другая моя любимая тема - новые технологии не уменьшают и не добавляют проблем. Они их ПЕРЕРАСПРЕДЕЛЯЮТ.

З.Ы. И про это так же запланированы главы. Они есть в черновике структуры книги, но пока не написаны. :)

 раскрыть ветвь  0
Написать комментарий
334 6 0
Наверх Вниз