Цифровое источниковедение - специфические проблемы - Михаил Елисейкин - читать книгу в онлайн-библиотеке

Цифровое источниковедение - специфические проблемы

4 347
Интернет позволяет историкам и другим исследователям получить доступ к множеству источников по теме. Однако, одновременно с этой возможностью, возникли и риски связанные с особенностями функционирования Интернета и цифровыми технологиями. В этой книге приведены примеры таких рисков и рекомендации по работе с цифровыми источникам.

Книга находится в процессе написания. Главы будут добавляться не в конец, а внутрь уже имеющейся структуры.
Впервые опубликовано
Добавили в библиотеку
21
Читают сейчас
15
Прочитали
1

Начало и конец дня на графике считаются по московскому времени (UTC +03:00)

Сортировать по

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Валевич Георгий Владимирович
#

Неплохая подборка по путям изменения информации в электронном виде. Для тех кто не специалист по организации работы Интернет, но работает с текстом (и контентом в целом) может быть полезно.

 раскрыть ветвь  0
iit
#

В плане хранения истории изменений бэкапы точно не спасают. Однако есть и способ который может спасти положение и им давно уже пользуются сами разработчики.

В среднем внезапно 3 000 000 строк кода (видел и больше). И вот в пятницу вечером всплывает ошибка. Нужно за 10 минут среди этого всего найти одну строку, найти кто её сделал, когда и в контексте какой задачи.

Для этого отлично подходит система контроля версий, например я использую git. Во первых она хранит всю историю проекта, во вторых позволяет без особой боли посмотреть разницу между всеми правками (по крайней мере с текстом работает отлично, с остальным сложнее). И самое вкусное это возможность ветвления которое позволяет одновременно держать несколько параллельных историй версий что важно для коллективной работы.

Хранить можно локально, на своем сервере или в одном из сторонних вариантов (gitlab/github/bitbucket) у которых ограничения бесплатной версии только на размер проекта и количество людей имеющих доступ.

В общем если важно история то система контроля версий наше всё. Если ещё и производители софта бы интегрировались с ними то вообще было бы круто.

 раскрыть ветвь  1
Михаил Елисейкин автор
#

Как человек поднявший это тему, я с Вами согласен.

Но потом я мысленно переключаюсь на другую роль и обнаруживаю, что чистема хранения версий увеличивает размеры файлов. И это требует места на диске, а значит - это дополнительные денежные и организационные траты.

А ещё, оказывается, что в этой системе будет храниться тот кусок который я скопипастил из чужой книжки и потом попереставлял местами слова и позаменял синонимы. Получается, что я таким образом ещё и улики против себя собираю.

И это исходя из предположения о том, что данная система просто встроена в текстовый редактор и не требует дополнительных усилий по настройке и изучению.

В результате, я "писатель" спрашиваю себя "историка" о том зачем мне весь этот напряг и затраты?

И ответ в том, что для абсолютного большинства авторов это не нужно.
И даже тем кому это нужно, оно всё равно не нужно - в массовом софте этого не будет, а оно не настолько нужно, чтобы заморачиваться с каким-то специфическом решением и переставать быть совместимым с массовым софтом.

Вобщем, скорее всего, придётся будущим историкам обойтись без наших черновиков. :(

 раскрыть ветвь  0
Михаил Елисейкин автор
#
 раскрыть ветвь  0
Александр Архипов
#

Да, цифровые источники имеют свойства портится. Только что убедился:

 раскрыть ветвь  1
Михаил Елисейкин автор
#

Ого. Спасибо.

Это устойчивая проблема?

Иконка Redader View - режим включён или нет?

 раскрыть ветвь  0
Михаил Елисейкин автор
#

Добавлено "10 - Утрата переписок"

Надеюсь что завтра будут главы в разделе :)

 раскрыть ветвь  0
Михаил Елисейкин автор
#

Добавлен вводный текст к разделу "5 - Утрата вариантов"

 раскрыть ветвь  1
Михаил Елисейкин автор
#

залит "5.1 - Бэкапы не спасают"

 раскрыть ветвь  0
iit
#

Про поисковые системы справедливо! Заточка информации не для пользователей а для seo однозначно имеется.

Смысла в такой лапше минимум, мало того сейчас мы подходим к генерации текстов нейросетями и ии. 

Смысл в этих текстах может и есть но точно не для человека 😆 

 раскрыть ветвь  1
Михаил Елисейкин автор
#

Да.

А многим людям явление "seo-контента" непонятно.

Они в тих текстах выискивают ошибки, критикуют и т.п.

 раскрыть ветвь  0
Леонов Дмитрий
#

При всей оригинальности и логичности методологии автора не могу согласиться с одним моментом - лично мне неизвестен ни один случай удаления антивирусом текстового файла. Исключением может быть скрипт-вирус, но он является текстовым файлом формально - это не осмысленный текст с точки зрения простого человека.

К главе 2.1. "Дешёвый и бессмысленный контент" можно добавить, что во многих случаях подобный контент создаётся не человеком, а специальной программой - генератором контента. Чем и объясняется его бессмысленность.

Другой причиной бессмысленности контента является копирование оригинального контента, как правило, написанного интересно и по делу. Копируют его к себе на сайт для привлечения посетителей, часто без ведома правообладателя, в неполном или искажённом виде. Поэтому при использовании поисковых машин на один запрос может найтись множество ссылок на текст идентичного или схожего содержания. В этом случае важно найти первоисточник, что бывает непросто.

 раскрыть ветвь  16
Валевич Георгий Владимирович
#

 У моей подруги файл с дипломом удалил как-то антивирус.2004г.

 раскрыть ветвь  14
Михаил Елисейкин автор
#

Осмысленность - очень субъективный критерий.

Программы и серверные логи (в моём примере это именно они) так же могут быть историческими источниками имеющими смысл и ценность для исследователя.

А в случае с программами, это не только источник, а и способ работы с источников (но об этом будет другой пример)

> В этом случае важно найти первоисточник, что бывает непросто.

Да, это это большая проблема.

Невозможность найти и аттрибутировать исходный текст, узнать кто-когда-зачем его писал, задать уточняющие вопросы и пр - это проблема связанная со спецификой функционирования поисковых сервисов. И об этом, так же будет глава.

Тут, кстати, тоже весьма неоднозначно.

С одной стороны, у нас вроде бы как копия и эквивалент "списка". И существование копий это хорошо - многие тексты и изображения дошли до нас именно в виде копий. И какие-то вещи, я уже сейчас могу найти только в виде копий, ибо сайты источники либо перестали существовать, либо были переделаны и искомое не пережило процесса обновления сайта.

Но, с другой стороны - при "живом" исходном материале я не могу его найти и вынужден бродить по копиям.

Это другая моя любимая тема - новые технологии не уменьшают и не добавляют проблем. Они их ПЕРЕРАСПРЕДЕЛЯЮТ.

З.Ы. И про это так же запланированы главы. Они есть в черновике структуры книги, но пока не написаны. :)

 раскрыть ветвь  0
Написать комментарий
260 4 0
Наверх Вниз