Проект BBC Genome - BBC Genome Project

Логотип BBC Genome

В Проект BBC Genome представляет собой оцифрованную базу данных программ с возможностью поиска, изначально основанную на содержании Радио Таймс с первого номера с 1923 по 2009 год.[1] Телепрограммы после 2009 г. доступны через Сайт программ BBC

История

Прежний

BBC Genome - не первая база данных BBC с возможностью поиска в Интернете; в апреле 2006 года BBC предоставила общественности доступ к Infax, базе данных программ BBC в то время. Infax содержал около 900 000 записей, но не все программы, которые когда-либо транслировались, и прекратил работу в декабре 2007 года.[2] Главная страница веб-сайта по-прежнему доступна для просмотра через Интернет-архив здесь. После того, как Infax прекратил свое существование, на веб-сайте появилось сообщение о том, что информация будет включена в отдельные страницы программы.[3] В 2012 году он был заменен базой данных Fabric, но только для внутреннего использования в BBC.

Радио Таймс

Скриншот ошибки распознавания текста (после исправления) в Genome. Текст «Рождество Узы Тарбука» следует читать:Лиза Тарбак Рождество ".

В декабре 2012 г. BBC завершил упражнение по оцифровке, отсканировав списки из Радио Таймс всех программ BBC с 1923 по 2009 год из общего тиража журнала, составляющего около 4500 экземпляров.[4] Они определили около пяти миллионов программ с участием 8,5 миллионов актеров, ведущих, сценаристов и технического персонала.[4]

Объявления опубликованы заранее, и поэтому не включают поздние изменения или отмены, которые были отражены в Infax. Тем не менее, они включают огромное количество ранних радио- и телепередач, а также "ди-джеев" от BBC Radio 1 и BBC Radio 2 которые редко хранились официально, которые не были перечислены в Infax (которые также обычно не включали повторы архивных программ до 1976 года), потому что их не было в архивах BBC.

Проблемы были отсканированы с высоким разрешением, TIF изображения и Оптическое распознавание символов Затем (OCR) использовалось для преобразования текста со страницы в текст, доступный для поиска в базе данных Genome.[1]

BBC Genome был выпущен для публичного использования 15 октября 2014 года.[5][6]

Цель этого проекта - позволить исследователям легче находить информацию и помогать BBC Архивы чтобы составить представление о том, что существует и чего сейчас не хватает в архиве.[7][8] Исправлены ошибки OCR и внесены изменения в объявленные расписания. краудсорсинг,[5] с более чем 440 910 пользовательскими правками, принятых после редакционной проверки по состоянию на середину декабря 2018 года.[9][10]

Каждая запись в листинге имеет уникальный идентификатор, который может быть выражен в виде URL-адреса. Например, первый показ Доктор Кто является http://genome.ch.bbc.co.uk/8f81c193ba224e84981f353cae480d49. Широковещательная программа может иметь более одного такого идентификатора, если она транслировалась (и, таким образом, перечислялась) неоднократно или в разных регионах.

Другой контент

Оцифрованные выпуски полных журналов (включая обложки, статьи в прозе, рекламные объявления и другой контент, не включенный в листинг) 1920-х годов были добавлены в марте 2017 года;[11] за 1930-е годы в декабре 2017 года;[12] за 1940-е годы в декабре 2018 года;[13] и для 1950-х годов в декабре 2019 года.[14]

Отсутствующие объявления

Дата выпуска[15]Причина[15]
14 мая 1926 г.Всеобщая забастовка
21 февраля 1947 г.Топливный кризис
28 февраля 1947 г.
8 сентября 1950 г.Печатный спор
13 октября 1950 г.
20 октября 1950 г.
27 октября 1950 г.
1 августа 1981 г.
2 апреля 1983 г.
9 апреля 1983 г.
3 декабря 1983 г.

Смотрите также

Рекомендации

  1. ^ а б «Об этом проекте». BBC. Получено 21 октября 2014.
  2. ^ «Об этом прототипе». BBC. Архивировано из оригинал 13 июня 2006 г.. Получено 2 февраля 2016.
  3. ^ "Это экспериментальное испытание прототипа завершено". BBC. Получено 2 февраля 2016.
  4. ^ а б Келион, Лев (7 декабря 2012 г.). «BBC завершает работу по оцифровке архива Radio Times». BBC Online. Получено 20 января 2013.
  5. ^ а б Епископ, Хилари (15 октября 2014 г.). «Геном - Архив Radio Times уже доступен». BBC Online. Получено 15 октября 2014.
  6. ^ Суини, Марк (16 октября 2014 г.). "BBC оцифровывает старые выпуски Radio Times". Хранитель.
  7. ^ «Проект BBC Genome предлагает списки архивов радио и телевидения». BBC. 16 октября 2014 г.. Получено 21 октября 2014.
  8. ^ Суини, Марк (16 октября 2014 г.). "BBC оцифровывает старые выпуски Radio Times". Хранитель. Получено 21 октября 2014.
  9. ^ "BBC One London - 20 апреля 1964 - BBC Genome". genome.ch.bbc.co.uk. Получено 2017-01-09.
  10. ^ «Часто задаваемые вопросы - BBC Genome». BBC. Получено 29 сентября 2017. Как только вы отредактируете запись, ваше предложение будет подтверждено, и в случае принятия Геном будет изменен. Если ваше предложение не соответствует журналу, мы включим ваше изменение в дополнительные данные, которые мы собираем для использования в будущем.
  11. ^ "BBC - BBC делает журналы Radio Times 1920-х годов доступными для общественности - Медиацентр". Блог BBC Genome. Получено 15 декабря 2018.
  12. ^ «Страницы истории - Radio Times в 1930-е годы». Блог BBC Genome. 5 декабря 2017 г.. Получено 15 декабря 2018.
  13. ^ "Radio Times в 1940-е годы - война и мир". Блог BBC Genome. 8 декабря 2018 г.. Получено 15 декабря 2018.
  14. ^ Мартин, Эндрю (22 декабря 2018 г.). "Radio Times - страницы 1950-х". Блог BBC Genome. Получено 26 декабря 2018.
  15. ^ а б «Освещает ли Radio Times / Genome каждую неделю в истории вещания BBC?». BBC Genome. Получено 17 июн 2018.

внешняя ссылка