Перейти к:
COVID-19.рф: информация против пандемии. Задачи и результаты проекта
https://doi.org/10.24108/2658-3143-2022-5-1-20-43
Аннотация
Авторы рассматривают задачи и результаты российского проекта «COVID-19.рф: информация против пандемии».
Начиная с 2020 года в мире были реализованы десятки проектов по созданию коллекций национальных публикаций в области исследования COVID-19 и размещения их в зеленом открытом доступе на платформах репозиториев. В общем списке таких проектов находится российский проект «COVID-19.рф: информация против пандемии».
В процессе разработки и создания репозитория COVID-19.рф были решены следующие задачи: разработано программное обеспечение для создания и пополнения платформы проекта; налажен двусторонний автоматический обмен данными с ранее созданными российскими платформами; реализован мониторинг и автоматическое пополнение коллекции российскими COVID-публикациями из международных наукометрических баз данных: Web of Science, Scopus, Dimensions и the Lens; реализован доступ и возможность передачи данных проекта по API с учетом синтаксиса протокола OAI PMH; проведено обучение пользователей; ресурсы проекта проиндексированы на платформах международных интеграторов CORE, OpenAire: COVID-19 Open Research Gateway и Google Академия.
В результате, были разработаны алгоритмы и найдены практические решения автоматического пополнения репозиториев в рамках правового поля, предоставляемого лицензией издателя. На начало 2022 года на платформу проекта загружены метаданные о 7380 российских COVID-публикациях, из которых 3923 статьи загружены в полных текстах. Эти показатели ставят российский проект в один ряд c национальными проектами Великобритании, Испании и Бразилии.
Ключевые слова
Для цитирования:
Зельдина М.М., Косяков Д.В., Кузнецов А.Ю., Лебедев В.В., Малышев А.В., Разумова И.К., Шварцман М.Е. COVID-19.рф: информация против пандемии. Задачи и результаты проекта. Наука и научная информация. 2022;5(1):20-43. https://doi.org/10.24108/2658-3143-2022-5-1-20-43
For citation:
Zeldina M.M., Kosyakov D.V., Kuznetsov A.Yu., Lebedev V.V., Malyshev A.V., Razumova I.K., Shvartsman M.E. COVID-19.rf: Information Against Pandemics: Project Goals and Results. Scholarly Research and Information. 2022;5(1):20-43. (In Russ.) https://doi.org/10.24108/2658-3143-2022-5-1-20-43
Введение и постановка задачи
После официального объявления пандемии COVID-19 многие ведущие научные издательства создали подборки публикаций, посвященных исследованиям нового коронавируса, и разместили их в специально созданных коллекциях, обеспечив к ним открытый доступ1. При этом большинство издателей предоставили к этим публикациям бронзовый открытый доступ или доступ, бесплатный для чтения, — “free to read”. Одновременно издатели разместили публикации из COVID-подборок в репозиториях открытого доступа (зеленый открытый доступ), в основном в репозитории PubMed Central Национальной медицинской библиотеки США (PMC, https://www.ncbi.nlm.nih.gov/pmc/).
Неограниченный доступ к научной информации ведет к интенсификации научных исследований, увеличивает скорость распространения и обмена научными знаниями, способствует созданию научных коллективов, занимающихся решением конкретных проблем и к успешному их разрешению. По данным базы Web of Science Core Collection (WoS CC) число публикаций в области коронавируса за период пандемии 2020–2021 гг. на январь 2022 года превысило 240 000 — это более 4 % от полного числа публикаций 2020–2021 гг в базе WoS CC.
В ряду проблем, вызванных пандемией, нельзя не отметить массовое распространение недостоверной информации. 2 февраля 2020 года, то есть еще до объявления пандемии, Всемирная организация здравоохранения (ВОЗ) заявила о «массовой инфодемии» — «эпидемии дезинформации», указав на обилие распространяемой недостоверной информации о вирусе, которая «мешает людям находить надежные источники и надежные рекомендации, когда им это необходимо». 15 февраля глава ВОЗ Тедрос Гебрейесус объявил инфодемию главным врагом в борьбе с коронавирусом2.
Безусловно, стратегически для уменьшения влияния инфодемии необходимо повысить информационную грамотность и развить критическое мышление у пользователей информации во всем мире, что является одной из официально сформулированных задач современного общества [1][2]. На практике же действенной и реальной возможностью в борьбе с инфодемией может оказаться неограниченное и свободное распространение достоверной научной информации открытого доступа. При этом, поскольку речь идет не об академическом сообществе, а о самых разных общественных группах, чрезвычайно важно, чтобы такая информация была представлена на национальных языках. Объективная, авторитетная и гораздо более понятная информация на родном языке может облегчить таким людям понимание их состояния, понимание того, что их ощущения — это стандартная для большинства людей ситуация.
Для решения обозначенных проблем практически одновременно с проектами издателей по переводу COVID-контента в бесплатный доступ возникла инициатива создания открытых платформ и репозиториев, объединяющих COVID-ресурсы национальной генерации. Чтобы обеспечить интероперабельность создаваемых репозиториев и их соответствие международным стандартам последнего поколения, Конфедерация репозиториев открытого доступа COAR3 разработала пакет рекомендаций для разработчиков национальных COVID-репозиториев [3]. В рекомендациях COAR была учтена последняя редакция требований к репозиториям со стороны кОАлицииS4 [4].
В результате к концу 2020 года в мире были реализованы десятки проектов по созданию коллекций национальных публикаций в области исследования COVID-19 и размещения их в зеленом открытом доступе на платформах репозиториев: в таблице 1 перечислены наиболее известные национальные и международные проекты.
Таблица 1. Национальные и международные проекты репозиториев ОД публикаций в области исследования COVID-19
Table 1. National and international repositories of COVID-publications
Наименование | URL | Страна | Кол-во записей |
OpenAIRE | ЕС/EU | 510 500 | |
IRUS-UK, JISC | Великобритания/UK | 25 450 | |
CORE | Великобритания/UK | 447 000 | |
DIGITAL CSIC Colección Especial COVID-19 | Испания/Spain | 1 003 | |
LA Referencia | Бразилия/Brazil | 10 000 |
Преимущества размещения публикаций в репозиториях отмечаются в регламентирующих документах [5–7] и научных публикациях [8–12]. Перечислим только некоторые из них:
- Репозиториев много: в январе 2022 года в регистре ROAR5 было зарегистрировано 4575 репозиториев.
- Объем ресурсов в репозиториях весьма значителен. Крупнейшие репозитории содержат десятки и сотни миллионов статей. На январь 2022 г. только в одном репозитории CORE размещены 207 млн статей из различных академических источников.
- Репозитории интероперабельны и могут пополнять коллекции друг друга.
- Контент репозиториев характеризуется высокой видимостью. Репозитории индексируются значительным количеством сервисов поиска научной информации. Сервисы подобные Unpaywall (https://unpaywall.org/) компании Our Research: (https://ourresearch.org/) позволяют легко находить полные тексты научных статей по описаниям и ссылкам на страницах сайтов научных поисковых систем и журналов [13]. Как сказано на сайте проекта https://unpaywall.org/sources, поиск проводится по крупнейшим индексам цитирования, а кроме того, почти по 50 000 отдельных независимых источников контента, включая журналы золотого и гибридного ОД, предметные и институциональные репозитории. Общий список источников доступен по ссылке https://api.oadoi.org/data/sources.csv и насчитывает более 103 000 адресов.
- Современные репозитории организованы по единым международным стандартам, метаданные публикаций, размещенных в репозиториях, имеют такие важные поля, как DOI, ORCID авторов, тип доступа (открытый/закрытый), конкретный тип лицензии (например: CC0, CC-BY), вид документа, версия статьи, индекс организации, в которой работает автор, индекс финансирующей организации.
- Преимущество в цитируемости публикаций открытого доступа. Вопрос этот интенсивно обсуждался в литературе на протяжении более 20 лет. Сегодня утверждение о том, что публикации открытого доступа цитируются чаще платных публикаций, можно легко проверить и подтвердить с помощью стандартных сервисов глобальных индексов цитирования (WoS CC, Scopus, Dimensions).
Тем же способом можно проверить утверждение о том, что дополнительное размещение статьи в репозитории приводит к значительному увеличению цитируемости статей [9][12].
Оценим влияние размещения в репозитории на число обращений к COVID-публикациям. На платформе проекта IRUS-UK приведены данные по статистике загрузок отдельных COVID-публикаций, размещенных в репозиториях Великобритании. Обратим внимание на высокие значения числа просмотров и загрузок публикаций, наибольшее из которых собрал отчет 2020 года [14], размещенный в репозитории Imperial College of London Spiral: Imperial College Digital Repository http://hdl.handle.net/10044/1/77482. На 1 января 2022 года публикация была загружена 165 345 раз. Проиллюстрируем влияние размещения в репозитории на статистику использования на примере только одной статьи [15]. Статья доступна на платформе журнала «Concurrent Disorders», где приведены данные о статистике использования. С момента публикации по январь 2022 года статья была загружена 1 412 раз. В то же время копия статьи, размещенная на платформе репозитория Ноттингемского университета Nottingham Trent University http://irep.ntu.ac.uk/id/eprint/39561/ и представленная в проекте IRUS-UK https://irus.jisc.ac.uk/coronavirus/, была загружена 10 920 раз. Следует отметить, что, несмотря на требования финансирующих организаций, возможности и очевидные преимущества дополнительного размещения статей в репозиториях, авторы статей не всегда реализуют свои права в отношении зеленого открытого доступа [16][17]. Даже в условиях широкой поддержки ОД для COVID-публикаций в репозитории переводятся только 80 и 84 % публикаций золотого и гибридного доступа соответственно. Для закрытых публикаций и публикаций бронзового доступа процент размещения в репозиториях ниже: 21 и 75 %. Если же рассмотреть массив публикаций МНБД WoS CC, опубликованных еще до наступления пандемии COVID-19, то цифры размещения статей в репозиториях оказывается еще ниже. Наши исследования статей WoS CC, опубликованных в интервале PY = 2006–2018 гг., показали, что к 2020 году в репозитории были загружены соответственно 59, 54 и 24 % статей золотого, гибридного и бронзового доступа и всего 6 % закрытых статей [18].
Причин этому несколько, одна из них — нежелание авторов тратить свое время на выяснение правовых и технических вопросов загрузки статей в репозиторий. Поэтому в последнее время решение этих вопросов взяли на себя организации, поддерживающие репозитории, и сами издатели [19]. Разрабатываются также коммерческие и некоммерческие сервисы, помогающие организациям пополнять свои репозитории в рамках правовых возможностей, предоставленных издателем, и в соответствии с требованиями финансирующей организации. В качестве примера можно привести сервис Publications Router https://pubrouter.jisc.ac.uk/, преоставляемый JISC. В настоящее время сервис доступен для 65 британских университетов и позволяет обеспечить автоматическое пополнение университетских репозиториев метаданными и/или полными текстами статей университетских авторов, опубликованными в журналах 11 крупнейших издательств, включая Elsevier, Wiley, Springer-Nature и Sage. Формат представления статей проверяется на соответствие требованиям издателя, а также требованиям Research Excellence Framework (REF) 2021 — программы аттестации британских университетов, проводимой UK Research and Innovation6. Требования предполагают неограниченный онлайн-доступ к опубликованным результатам исследований. При этом результаты академических исследований должны быть доступны в электронном виде немедленно, бесплатно и без авторских или лицензионных ограничений7.
Проекты создания национальных репозиториев публикаций в области исследований COVID-19 решают проблему автоматического пополнения репозиториев в рамках правового поля, предоставляемого лицензией издателя.
В общем списке таких проектов находится и российский проект «COVID-19.рф: информация против пандемии», анализу задач и результатов которого посвящена настоящая работа. Актуальность проекта определили: наличие социального запроса со стороны российского академического сообщества; значительный рост числа COVID-ресурсов российской генерации; отсутствие решения в пространстве научной информации российской генерации; наличие международных инициатив, призывающих к созданию открытых платформ и репозиториев, объединяющих открытые COVID-ресурсы; готовые рекомендации со стороны международного академического сообщества и большое число успешно реализованных проектов в разных странах.
По мнению исполнителей проекта, создание репозитория российских COVID-ресурсов должно способствовать международному признанию работ российских ученых. Пандемия привела не только к стремительному росту числа COVID-публикаций, но и обострила конкуренцию за лидерство в области научных исследований. Проблемы международного признания российской науки и российских ученых, особенно молодых и работающих в небольших научных центрах, связаны с высокой конкуренцией при публикации статей в международных журналах, а также с низким цитированием российских статей. Публикации же в российских журналах, не включенных в МНБД, имеют совсем мало шансов быть прочитанными зарубежными коллегами. В то же время, как уже было отмечено, размещение их на сайтах препринтов или в репозиториях увеличивает цитирование этих работ и число обращений к ним.
Проект был инициирован в конце 2020 года8 и реализован с 15 января по 15 сентября 2021 г. при поддержке фонда Президентских грантов. Партнерами проекта выступили Федеральное государственное бюджетное учреждение «Научный центр экспертизы средств медицинского применения» Министерства здравоохранения Российской Федерации; Федеральное государственное бюджетное учреждение «Национальный медицинский исследовательский центр хирургии имени А.В. Вишневского» Министерства здравоохранения Российской Федерации; Научный медицинский журнал «Медицинская визуализация»; Научный медицинский журнал «Анналы хирургической гепатологии»; Федеральное государственное бюджетное образовательное учреждение высшего образования «Башкирский государственный медицинский университет» Министерства здравоохранения Российской Федерации. Помимо партнеров проекта, публичные мероприятия проекта поддержал Российский государственный педагогический университет им. А.И. Герцена.
В процессе разработки и создания репозитория COVID-19.рф были использованы ранее рассмотренные подходы к созданию тематического репозитория [20] и решены следующие задачи:
- Разработка программного обеспечения создания коллекции «COVID-19.рф: информация против пандемии».
- Наполнение коллекции COVID-ресурсами проекта «Открытая наука России» и ресурсами платформ elpub.ru и preprint.ru: журнальными статьями и препринтами.
- Мониторинг и автоматическое пополнение коллекции статьями ОД МНБД Web of Science, Scopus, Dimensions и the Lens с использованием поисковых предписаний и/или API к каждой из баз данных.
- Создание API к разрабатываемой системе.
- Продвижение проекта и обучение пользователей.
- Интеграция российского проекта в мировое информационное пространство по коронавирусам с тегом COVID-19.
При решении поставленных задач были учтены рекомендации Конфедерации репозиториев открытого доступа и обновленные требования Plan S cOAlitionS к ОД репозиториям. Рассмотрим последовательно подходы к решению каждой из задач.
1. Разработка программного обеспечения для создания репозитория
Репозиторий создан на платформе ERS (Elpub repository system), разработанной ООО «ВЦИ». Платформа ERS построена на основе бесплатного веб-фреймворка с открытым кодом Laravel, предназначенного для разработки с использованием архитектурной модели MVC (Model — View — Controller). Laravel выпущен под лицензией MIT. При разработке использовалась версия 7.3 языка PHP. В качестве базы данных используется свободная реляционная система управления базами данных MySQL Server. Для организации поиска используется свободная программная поисковая система ElasticSearch. Сама платформа функционирует в контейнере Docker. В качестве веб-сервера используется российское программное обеспечение nginx, распространяемое под лицензией FreeBSD. Репозиторий доступен по адресу https://covid19.neicon.ru/.
2. Наполнение коллекции COVID-ресурсами
2.1. Разработка поисковых предписаний
Исходный список ключевых слов для составления поискового запроса был сформирован на основе списка терминов, предложенных COAR: SARS-CoV; HCoV-19; MERS-CoV mesh:C000657245; Sindrome Respiratorio Agudo Severo; mesh:C0VID-19; COVID2019; COVID-19; SARS-CoV-2; 2019 novel coronavirus; severe acute respiratory syndrome coronavirus; 2 Orthocoronavirinae; Coronaviridae mesh:D045169; coronavirus; SARS; coronaviruses, coronavirus disease-19 sars cov 2; Middle East Respiratory Syndrome; Severe acute respiratory syndrome coronavirus 2; Severe Acute Respiratory Syndrome coronavirus disease 2019; 2019-nCoV.
Следует отметить, что большинство COVID-репозиториев, перечисленных в таблице 1, использовали в поисковых запросах список ключевых слов, предложенных COAR, без всяких изменений. В случае создания российского репозитория COVID-19.рф командой проекта была проведена экспертиза и уточнение поискового запроса с участием представителей российского медицинского академического сообщества. В соответствии с КП проекта COVID-19.рф, список COAR был разослан четырем российских экспертам-медикам, занимающимся научной деятельностью и информационным поиском, с целью получить оценку полноты, релевантности и нахождения соответствующих терминов на русском языке. В результате совместной работы с экспертами был составлен список ключевых слов для составления поисковых запросов, использованных в проекте. Тексты поисковых предписаний на языках МНБД WoS CC, Scopus, the Lens приведены в Приложении 1.
Поскольку бесплатная версия МНБД Dimensions не допускает использования фильтра по стране публикации, выделить работы российских авторов не представлялось возможным. В связи с этим была поставлена отдельная работа [20] с использованием массива открытых COVID-данных платформы Dimensions https://www.dimensions.ai/covid19/, специально созданного компанией Digital Science. Для извлечения российского сегмента данных был использован SQL-запрос к Облачной платформе Google Cloud Platform GOOGLE — COVID-19 data on BigQuery по адресу https://console.cloud.google.com/marketplace/product/digitalscience-public/covid-19-dataset-dimensions?pli=1&project=neicon-covid (см. Приложение 1.5).
2.2. Разработка ПО для автоматического запуска поискового запроса
Разработчиками платформы проекта было создано ПО для запуска поискового запроса к платформам проекта «Открытая наука России», elpub. ru и preprint.ru. Для автоматического запуска поискового запроса были разработаны два скрипта, реализующие разные технологии импорта. Выбор технологии определялся функциональными возможностями репозиториев, из которых производится импорт. Для импорта из платформы ElPub, у которой есть хорошо разработанный программный интерфейс приложения (Application Programming Interface, API), был написан скрипт для поиска и импорта документов посредством запроса к API.
Для работы с репозиториями «Открытая наука России» и preprints.ru, у которых для решения задач экспорта и импорта используется протокол OAI-PMH (The Open Archives Initiative Protocol for Metadata Harvesting), был разработан скрипт для импорта найденных документов посредством запроса по этому протоколу.
2.3. Загрузка материалов российских исследований
На январь 2022 г. из репозитория preprinrts.ru выгружены 170 статей (метаданные и полные тексты), относящиеся к тематике проекта. Из платформы elpub.ru были выгружены 569 статей, посвященных covid-19. Все полные тексты были выгружены и размещены на сервере Covid19.neicon.ru/files. На платформе проекта COVID-19.рф по ссылке на кнопку «PDF» происходит переход на сервер полных текстов Covid19.neicon.ru/files/… и оттуда предъявляется полный текст для показа читателю.
Также в метаданных приводится ссылка URL на сайт издателя. При активации ссылки в метаданных (например, https://doi.org/10.15829/1728-8800-2020-2605) происходит переход к карточке публикации на сайте издателя.
3. Масштабирование коллекции
3.1. Оптимизация поискового запроса на платформе Web of Science
Как сказано выше, список ключевых слов, полученный от COAR, был протестирован российскими экспертами с целью оценки его полноты, релевантности и значимости отдельных терминов. Для оценки значимости терминов для поиска было проведено тестирование в БД PubMed Central. В настоящее время официальными (используются ВОЗ) и наиболее часто используемыми обозначениями нового коронавируса и вызываемой им болезни являются SARS-CoV-2 и COVID-19 соответственно. Как показал опыт, использование других вариантов названий в качестве ключевых слов не увеличило количество получаемых ссылок. Наибольшее количество ссылок в PubMed было получено в ответ на использование термина COVID-19 — свыше 97 тысяч. При использовании термина COVID2019 был получен только 161 результат; SARS-CoV-2 — свыше 60 тыс. Сочетание COVID-19 OR SARS-CoV-2 дало 99 тысяч. Тем самым добавление в поиск термина SARS-CoV-2, помимо COVID-19, несущественно увеличивает количество получаемых ссылок, то есть, скорее всего, термин COVID-19 как ключевое слово входит практически во все публикации в области исследований нового коронавируса.
Тем не менее было решено, что для поиска в базах данных целесообразно использовать весь набор ключевых слов, являющихся, по сути, синонимами. То есть для обозначения болезни использованы ключевые слова: COVID-19, COVID2019, coronavirus disease-19, coronavirus disease 2019. Для обозначения возбудителя болезни: SARS-CoV-2, HCoV-19, 2019 novel coronavirus, sars cov 2, Severe acute respiratory syndrome coronavirus 2, 2019-nCoV.
Для более полного учета статей российских авторов была предпринята попытка добавления ряда российских терминов, предложенных экспертами. Однако, как показал опыт проведения поисков с этими терминами, они подходят только для уточнения поисковых запросов, то есть для уменьшения количества полученных результатов. Во всех остальных случаях в найденных документах либо уже присутствуют термины из основного списка, либо эти документы не имеют отношения к COVID-19. По результатам испытаний от этих терминов было решено отказаться.
Запросы были протестированы в базах Web of Science Core Collection на всех входящих в базу индексах, в том числе и в русскоязычном индексе Russian Science Citation Index компании «Clarivate Analytics».
В таблице 2 приведены результаты применения поисковых запросов в перечисленных выше базах данных. Получены данные о полном числе COVID-публикаций, полном числе COVID-публикаций в открытом доступе, полном числе COVID-публикаций российских авторов и полном числе COVID-публикаций российских авторов в открытом доступе. Данные приведены на две даты тестирования: от 22 февраля 2021 г. для временного интервала PY = 2000–2021 и на 15 января 2022 г. для временных интервалов PY = 2000–2021 и PY = 2020–2022.
Таблица 2. Результаты поиска COVID-публикаций на платформе Web of Science. Результаты получены на две даты тестирования 22 февраля 2021и 15 января 2022 г. для временных интервалов PY=2000-2021 и PY=2020-2022.
Table 2. COVID-publications on Web of Science platform. Results obtained on 22 February 2021 and 15 January 2022. PY=2000-2021 and PY=2020-2022
База данных / WoS database | WoS CC | RSCI | Все базы платформы WoS / All WoS databases | |||||||
Временной интервал и дата тестирования / Publication years | Полное число COVID-публикаций / Total number of COVID-publications | Число COVID-публикаций в открытом доступе / the number of OA COVID-publications | Число COVID-публикаций российских авторов / the number of Russian COVID-publications | Число COVID-публикаций российских авторов в открытом доступе / the number of Russian OA COVID-publications | Полное число COVID-публикаций / Total number of COVID-publications | Число COVID-публикаций в открытом доступе / the number of OA COVID-publications | Полное Число COVID-публикаций / Total number of COVID-publications | Число COVID-публикаций в открытом доступе / the number of OA COVID-publications | Число COVID-публикаций российских авторов / the number of Russian COVID-publications | Число COVID-публикаций российских авторов в открытом доступе / the number of Russian OA COVID-publications |
PY=2000-2021, 22.02.2021 | 94 550 | 1 046 | 523 | 154 915 | 110 722 | 865 | ||||
PY=2000-2021, 15.01.2022 | 272 523 | 204 557 | 2 953 | 2 053 | 3 214 | 1 456 | 403 262 | 249 503 | 3 381 | 2 222 |
PY=2020-2022, 15.01.2022 | 245 706 | 190 401 | 2 586 | 1 927 | 2 634 | 1 363 | 346 603 | 229 934 | 2 819 | 2 051 |
3.2. Мониторинг статей закрытого доступа
В отличие от статей золотого и гибридного открытого доступа статьи закрытого доступа, (равно как и статьи зеленого и/или бронзового открытого доступа) не имеют лицензии Creative Commons или других лицензий открытого доступа и не могут быть загружены в репозитории без дополнительного изучения их правового статуса.
Рассмотрение правовых вопросов при пополнении репозиториев и, в частности, репозитория COVID-19.рф будет изложено ниже.
Мониторинг COVID-публикаций закрытого доступа в МНБД проведен с использованием библиотеки поисковых предписаний для МНБД: Scopus, Web of Science (Web of Science Core Collection и Russian Science Citation Index), The Lens. Поисковые предписания для каждой МНБД приведены в Приложении 1.
Полный массив закрытых COVID-публикаций для всех четырех МНБД содержит 6136 публикаций или 5710 публикаций за вычетом дублирования в разных МНБД.
Помимо массивов COVID-публикаций закрытого доступа в каждой из МНБД мы провели мониторинг всех COVID-публикаций, не имеющих лицензий открытого доступа. Такой расширенный массив состоит из закрытых COVID-публикаций и COVID-публикаций бронзового и зеленого ОД, а также unknown — неизвестного типа доступа. Расширенный массив закрытых COVID-публикаций для всех четырех МНБД содержит 8658 публикаций без учета дублирования и 7917 публикаций после учета дублирования.
Метаданные полученных массивов российских публикаций были выгружены в файл в формате excel с использованием API к МНБД.
3.3. Мониторинг статей открытого доступа
3.3.1. Разработка технологии мониторинга
Технология мониторинга была основана на использования библиотеки скриптов, разработанных на предыдущем этапе работ для автоматического мониторинга МНБД, выгрузки найденных результатов и загрузки их в репозиторий. По сформированному расписанию автоматически через API запросы из этой библиотеки регулярно отправлялись в соответствующие МНБД. Выгруженные метаданные сравнивались с уже имеющимися в базе проекта и отсутствующие конвертировались и загружались в базу. Затем по DOI автоматически проводился поиск полных текстов для загруженных метаданных через сервис Crossref. При нахождении полные тексты скачивались и загружались в базу проекта.
Обязательным этапом технологии является постоянный экспертный анализ результатов поисков на предмет адекватности полученных результатов. Как показал опыт, подбор ключевых слов периодически необходимо корректировать, потому что, с одной стороны, появляются новые термины, которые нужно включить, и с другой стороны, уже используемые термины начинают применяться в других отраслях. Также как обязательный этап технологии мониторинга был включен количественный анализ получаемых результатов. Это позволяет выяснить как наиболее перспективные источники информации, так и сервисы, которые не очень активно пополняются новыми источниками.
3.3.2. Проведение мониторинга
Результаты проведения мониторинга COVID-публикаций открытого доступа в различных источниках сведены в таблице 3.
Таблица 3. Число COVID-публикаций, загруженных на платформу проекта из разных источников. Приведено число загруженных метаданных и полных текстов публикаций по состоянию на 15 января 2022 г. для временных интервалов PY=2000–2021 и PY=2020–2021
Table 3. The number of COVID-publications downloaded on the project platform from different sources. The number of metadata and full-texts as on 15 January 2022, PY=2000–2021 and PY=2020–2021
PY=2000–2021 | PY=2020–2021 | |||
Источник / Source | Число статей c метаданными / Metadata downloaded | Число статей в полных текстах / FT downloaded | Число статей c метаданными / Metadata downloaded | Число статей в полных текстах / FT downloaded |
Scopus | 4 769 | 2 005 | 3 821 | 1 556 |
The Lens | 301 | 82 | 293 | 79 |
Dimensions | 1 495 | 636 | 1 495 | 636 |
Elpub | 643 | 569 | 643 | 643 |
Preprint | 170 | 170 | 170 | 170 |
Всего / Total | 7 380 | 3 923 | 6 615 | 2 521 |
Все найденные метаданные и полные тексты статей были загружены в систему. Всего были загружены метаданные о 7380 статьях, из которых для 3923 статей загружены полные тексты. В дальнейшем было принято решение ограничить массив публикаций только периодом пандемии, то есть начиная с 2020 года. Все предыдущие публикации перенесены в архив и могут быть восстановлены.
3.4. Решение правовых вопросов пополнения репозиториев открытого доступа
Решение правовых вопросов пополнения репозиториев определяется положениями авторской лицензии конкретного издателя — владельца авторских прав по отношению к тому или иному типу доступа. В настоящее время при отнесении публикаций к определенному типу доступа крупнейшие МНБД используют информацию компании «Our Research». Все публикации, отнесенные МНБД (например, Scopus9 и Web of Science)10 к золотому (Gold) или гибридному (Hybrid) открытому доступу (ОД), по определению имеют открытую лицензию11, разрешающую неограниченное дальнейшее использование таких публикаций. Как правило, это одна из лицензий Creative Commons (СС). Наличие у публикации открытой лицензии дает возможность любым лицам и организациям размещать такие публикации в любых репозиториях и других открытых платформах. Отнесение публикации к закрытому (paywall, PW), бронзовому (Bronze) и зеленому (Green) типу доступа в классификации МНБД Scopus и Web of Science означает, что либо лицензия этой публикации не относится к открытым лицензиям, либо тип лицензии невозможно установить с помощью используемых в МНБД сервисов. В этом случае без рассмотрения положений конкретной лицензии невозможно определить, разрешает ли издатель размещать публикацию в репозитории12, а если разрешает, то когда, где и в каком виде возможно размещение.
Решением проблемы может стать разработка методики и механизма автоматического определения правового статуса научных публикаций, не имеющих открытой лицензии. Такая задача была сформулирована в рамках выполнения проекта «COVID-19.рф: информация против пандемии» применительно к COVID-публикациям российских авторов, представленных в МНБД Scopus, WoS CC, Dimensions и The Lens. Правовой статус публикаций, не имеющих открытой лицензии, определялся c использованием базы данных проекта Sherpa/RoMEO [21][22]. Sherpa/RoMEO [23] — один из набора сервисов Sherpa для исследователей и научных организаций, предоставляющих информацию, позволяющую принимать информированные решения в области открытого доступа. Sherpa/RoMEO — бесплатный ресурс, поддерживаемый JISC13 — некоммерческой организацией, занимающейся поддержкой организаций науки и высшего образования в Великобритании.
Sherpa/RoMEO агрегирует информацию о политиках открытого доступа научных издателей и изданий. В базе данных Sherpa/RoMEO представлена информация о политиках открытого доступа более чем 5 тысяч издателей и 32 тысяч журналов со всего мира. Доступ к этой информации обеспечивается как через публичный веб-интерфейс, так и посредством открытого к использованию программного интерфейса (API). Разработанный нами алгоритм автоматического определения правового статуса закрытых научных публикаций с использованием API платформы Sherpa/RoMEO приведен в Приложении 2.
Полученные результаты
В результате анализа полного массива данных платформы Serpa/RoMEO были определены политики издателей по отношению к размещению публикаций в зеленом ОД на разных платформах открытого доступа. Была получена информация по 22 129 журналам, допускающим хотя бы один вариант размещения в зеленом ОД статей в версии accepted; 21 436 журналам — в версии submitted и 8 218 журналам — в версии published. Из рассмотрения были исключены издательские политики в отношении журналов золотого ОД (журналы базы «Директория журналов открытого доступа», DOAJ14) и в отношении публикаций, переведенных в гибридный ОД. Тем самым были рассмотрены журналы закрытого и бронзового ОД.
Результаты анализа возможности размещения публикаций закрытого и бронзового доступа в версиях accepted, submitted и published на разных платформах зеленого ОД приведены в таблице 4. Получены значения числа журналов N(i), издатели которых разрешают размещение в зеленом ОД публикаций заданной версии: accepted, submitted или published на различных платформах ОД (i, location) и процентной доли %N(i) таких журналов в общем числе журналов, разрешающих размещение в зеленом ОД публикаций рассматриваемой версии, N. %N(i) = N(i)/N.
Табл. 4. Результаты анализа политик издателей журналов, разрешающих размешение публикаций закрытого и бронзового доступа на разных платформах ОД
Table 4. Results of the analysis of journal publisher policies towards downloading of paywall and Broze OA publications on different OA platforms (locations)
Версия статьи / Article version | Accepted | Submitted | Published | Accepted | Submitted | Published |
Тип платформы / location type | Число журналов, N(i) / Number of journals, N(i) | Число журналов, N(i) / Number of journals, N(i) | Число журналов, N(i) / Number of journals, N(i) | Процентная доля, %N(i) / Percent share, %N(i) | Процентная доля, %N(i) / Percent share, %N(i) | Процентная доля, %N(i) / Percent share, %N(i) |
репозиторий / repository | 18 685 | 18 342 | 6 417 | 84 % | 86 % | 78 % |
институциональный репозиторий / institutional repository | 14 829 | 8 433 | 4 133 | 67 % | 39 % | 50 % |
домашняя страница автора / authors homepage | 12 979 | 12 857 | 3 816 | 59 % | 60 % | 46 % |
COVID-19.рф / COVID-19.rf | 9 257 | 5 088 | 2 668 | 42 % | 24 % | 32 % |
предметный репозиторий / subject repository | 8 503 | 4 428 | 0 | 38 % | 21 % | 0 % |
поименованный репозиторий / named repository | 7 061 | 9 648 | 606 | 32 % | 45 % | 7 % |
вебсайт / website | 6 442 | 10 186 | 1 994 | 29 % | 48 % | 24 % |
институциональный веб-сайт / institutional website | 4 947 | 4 654 | 655 | 22 % | 22 % | 8 % |
некоммерческий институциональный репозиторий / non commercial institutional repository | 3 640 | 2 770 | 2 330 | 16 % | 13 % | 28 % |
репозиторий препринтов / preprint repository | 3 186 | 7 021 | 0 | 14 % | 33 % | 0 % |
платформа, заданная финансирующей организацией / funder designated location | 2 563 | 557 | 194 | 12 % | 3 % | 2 % |
любой репозиторий / any repository | 2 559 | 2 036 | 2 559 | 12 % | 9 % | 31 % |
некоммерческий репозиторий / non commercial repository | 2 211 | 2 119 | 427 | 10 % | 10 % | 5 % |
академическая социальная сеть / academic social network | 2 044 | 3 772 | 40 | 9 % | 18 % | 0 % |
некоммерческий веб-сайт / non commercial website | 224 | 301 | 228 | 1 % | 1 % | 3 % |
Всего журналов, N / Total # of journals, N | 22 129 | 21 436 | 8 218 | 100 % | 100 % | 100 % |
Анализ политик издателей по отношению к размещению публикаций закрытого и бронзового доступа на платформах зеленого ОД, аналогичных COVID-9.рф, показывает, что 42 % издателей разрешают размещение таких публикаций в версии accepted, 24 % — в версии submitted.
Применительно к задачам данного проекта были проанализированы возможности размещения в репозитории COVID-19.рф российских COVID-публикаций, не имеющих открытой лицензии. Для этого были выполнены следующие работы: рассмотрены издательские политики зеленого ОД по отношению к закрытым и бронзовым публикациям и публикациям, размещенным на других площадках зеленого ОД; определен массив российских COVID-публикаций в версиях accepted, submitted или published, правовой статус которых разрешает их размещение в репозитории COVID19.рф.
Размещение в репозитории COVID19.рф отвечает следующим значениям переменной “location” в базе данных платформы Sherpa/RoMEO: any website, non commercial website, any repository, non commercial repository, subject repository, subject repository, preprint repository и non commercial subject repository.
Результаты анализа приведены в таблице 5.
Табл. 5. Результаты анализа возможности размещения в репозитории COVID19.рф российских COVID-публикаций, не имеющих открытой лицензии
Table 5. Possibility for downloading of Russian COVID-publications having no open license in the COVID19.rf repository
Версия / Version | Число публикаций / Publications | Число публикаций, которые могут быть размещены в COVID19.rf репозитории / Allowed for downloading in the COVID.rf repository |
Submitted | 1 374 | 116 |
Аccepted | 1 885 | 871 |
Published | 512 | 184 |
В метаданные массива российских COVID-публикаций закрытого, бронзового и зеленого доступа добавлена информация в поля location, embargo и license для каждой из трех возможных версий (submitted, accepted, published), возможно размещение публикации в репозитории COVID19.рф
Результаты анализа представлены в материалах международной конференции «COVID-19.рф: информация против пандемии»15 [24][25].
Для всех статей, которые были определены в предыдущей работе как разрешенные для загрузки в том или ином виде в репозиторий проекта, были проведены поиски полных текстов версий Submitted/Accepted/Published в различных репозиториях препринтов. Нам не удалось найти ни одной версии таких статей, которые бы автор самостоятельно разместил в репозитории. При поисках были обнаружены ошибки МНБД в определении статусов статей. Ручная проверка показала, что ряд статей, отнесенных сервисом Unpaywall к статьям закрытого доступа, то есть к статьям, для которых не удалось обнаружить наличие открытой лицензии, на самом деле были статьями открытого доступа.
4. Создание API к разрабатываемой системе
4.1. Использование протокола OAI PMH
Для предоставления доступа по API был выбран протокол OAI PMH. Был реализован доступ к данным проекта, так, чтобы все желающие могли забирать данные с учетом синтаксиса протокола OAI PMH. Адрес OAI PMH севера проекта https://covid19.neicon.ru/oai/. Например, по запросу https://covid19.neicon.ru/oai/request?verb=GetRecord&identifier=oai:covid19.neicon.pro:dc/1&metadataPrefix=oai_dc отправляется требование выгрузить запись № 1. Аналогичным образом могут быть выгружены последующие записи.
4.2. Двусторонний автоматический обмен данными с платформами проекта «Открытая наука России», elpub.ru и preprint.ru
На платформе проекта «Открытая наука России» (openrepository.ru) создан новый репозиторий с названием «Covid-19.рф: информация против пандемии». В этот репозиторий по описанному выше API были выгружены все метаданные из портала https://covid19.neicon.ru/. Полные тексты не переносились, и для просмотра полного текста из описания документа, найденного на https://www.openrepository.ru/, ссылка «Просмотр» ведет на портал https://covid19.neicon.ru.
Был налажен обмен данными и в обратную сторону от платформы проекта «Открытая наука России» к порталу https://covid19.neicon.ru. Метаданные всех публикаций репозиториев платформы «Открытая наука России», посвященных COVID-19, были выгружены и размещены на портале https://covid19.neicon.ru. Поиск на портале по источнику данных openrepository.ru показывает, что на портал https://covid19.neicon.ru перенесено 170 документов с платформы проекта «Открытая наука России».
В рамках работы по проекту был налажен двухсторонний обмен данными и с проектами elpub. ru и preprints.ru. Результаты загрузки данных из elpub. ru и preprints.ru на портал проекта СOVID-19. рф показаны в разделе 2.3. Одновременно был организован обратный обмен данными. Для всех статей, у которых в ключевых словах имелось слово «COVID», ко всем ключевым словам добавлен значок — ссылка на портал проекта СOVID-19.рф:
При клике по этому значку пользователь автоматически переходит на портал СOVID-19.рф на страницу поиска по тому ключевому слову, над которым находился этот значок.
5. Продвижение проекта и обучение пользователей
В рамках проекта были предусмотрены мероприятия, направленные на продвижение проекта и обучение пользователей работе с информацией. Они включали регулярное информирование о проекте, проведение обучающих мероприятий (вебинара и семинара), а также подготовку методических рекомендаций для разработчиков.
Регулярное информирование о проекте подразумевало несколько рассылок по базе данных НЭИКОН (адреса организаций-участников НЭИКОН, а также адреса участников мероприятий, проводимых НЭИКОН) с информацией о текущем состоянии проекта и приглашением присоединиться к Декларации об объединении усилий научного сообщества в борьбе с COVID-19. Участники проекта, которые приняли решение подписать ее от имени организации, соглашались со следующими принципами:
- материалы и данные должны публиковаться настолько оперативно, насколько это возможно;
- правовой статус публикуемых материалов и данных должен обеспечивать возможность их использования представителями научного сообщества, а также ознакомления для любых заинтересованных лиц;
- необходимым условием обеспечения доступа к общественно значимой информации является повышение уровня правовой грамотности всех участников процесса создания и распространения материалов и данных.
28 мая 2021 г. прошел семинар «COVID-19.рф: информация против пандемии» на площадке РГПУ им. А. И Герцена. На семинаре рассматривались этапы и запланированные результаты проекта и лучшие публикационные практики открытого доступа в применении к проблематике нового коронавируса. Семинар проводился в рамках дополнительной профессиональной программы повышения квалификации «Эффективность научных исследований и публикационная активность образовательных и научных организаций: стратегия развития, управление, мониторинг, информационная поддержка».
Видеозаписи семинара размещены на сайте проекта: https://covid19.neicon.ru/news/seminar_may_28_materials
22 июня 2021 г. состоялся вебинар «COVID-19.рф: информация против пандемии», на котором рассматривались технические и правовые вопросы, связанные с эффективным сбором и корректным размещением публикаций и исследовательских данных в университетских репозиториях и на других платформах открытого доступа. Вебинар был ориентирован на разработчиков и специалистов, работающих или планирующих работать с репозиториями и открытыми данными, а также авторов научных публикаций и сотрудников, занимающимся сбором информации о публикационной активности своей организации.
Презентации и видеозаписи семинара размещены на сайте проекта: https://covid19.neicon.ru/news/seminar_june_22
Для помощи участникам проекта были подготовлены «Методические рекомендации по поддержке репозиториев». Они были основаны на рекомендациях, подготовленных Конфедерацией репозиториев открытого доступа (COAR) для репозиториев, в которых планируется размещать материалы, связанные с коронавирусом. Методические рекомендации посвящены вопросам передачи метаданных агрегаторам по протоколу OAI-PMH, взаимодействию с системой индексирования Google Scholar, использованию контролируемых словарей и др. Они предназначены для разработчиков репозиториев, аналитиков, сотрудников научных библиотек. Методические рекомендации размещены на сайте проекта: https://covid19.neicon.ru/news/materials
6. Интеграция российского проекта в мировое информационное пространство
Все метаданные, собранные в ходе проекта по протоколу OAI PMH, передаются таким международным интеграторам, как CORE (https://core.ac.uk/search?q=COVID-19), OpenAire: COVID-19 Open Research Gateway (https://beta.covid-19.openaire.eu/) и Google Академия (https://scholar.google.com/). Количество проиндексированных метаданных у разных интеграторов получается различным и связано с их внутренними технологическими процессами. На платформе Google Академия поиск по источнику данных (site: covid19.neicon.ru) выдает список всего 233 статей, доступных на нашем портале. На портале проекта OpenAire: Open Research Gateway (https://beta.covid-19.openaire.eu/), поиск по провайдеру контента Provider: COVID-19.рф: Information against the pandemic дает 3 490 результатов. Полные тексты открываются по переходу на портал проекта.
На платформе агрегатора CORE поиск по ключевому слову «COVID-19» с ограничением по репозиторию «NEICON» дает 3449 результатов. При этом, если изменить текст поискового запроса, добавив в запрос термин «SARS-2», поисковая система CORE выдает для репозитория NEICON уже 3 645 статей. Мы также провели поиски с использованием запроса проекта COVID-19.рф. Применение только русскоязычной части запроса проекта дает 4 911 результатов, из них 480 — статьи на платформе проекта COVID-19.рф. Англоязычная часть запроса находит 739 002 публикации (3688 из них на платформе проекта). Обе части запроса на 10 января 2022 года выдали 740 814 результатов, из них 3 734 на платформе NEICON.
Заключение
Создание в сжатые сроки репозиториев агрегированного доступа к открытым научным исследованиям по актуальным проблемам решает задачи оперативного обеспечения исследователей по направлению COVID-19.рф, способствует обеспечению доступа к достоверной информации, гарантирует получение сведений из достоверных источников и препятствует недостоверным данным, что в случае с медицинской научной информацией может создать угрозу жизни и здоровью. Авторы констатируют, что поставленные перед началом реализации проекта цели были достигнуты.
- Разработано ПО и создан репозиторий российских COVID-публикаций на платформе ERS (Elpub repository system).
- В метаданные добавлены новые поля с учетом рекомендации Конфедерации репозиториев открытого доступа и требований Plan S cOAlitionS к ОД.
- По итогам консультаций с российскими экспертами исходный список ключевых слов доработан для поиска российских COVID-публикаций.
- Составлены двуязычные поисковые предписания для поиска российских COVID-публикаций в МНБД Web of Science, Scopus, Dimensions и the Lens и национальных платформах «Открытая наука России», ElPub и preprints.ru.
- Налажен мониторинг и автоматизированное пополнение коллекции статьями ОД с помощью оригинальных поисковых предписаний и API к МНБД Web of Science, Scopus, Dimensions и the Lens.
- Налажен двухсторонний обмен данными о российских COVID-публикациях с российскими платформами «Открытая наука России», elpub.ru и preprint.ru.
- Проведен анализ полного массива данных платформы Serpa/RoMEO и определены политики издателей по отношению к размещению публикаций на разных платформах открытого доступа. Проанализирован правовой статус и возможность размещения в репозитории COVID-19.рф российских COVID-публикаций, не имеющих открытой лицензии.
- Реализован доступ к данным проекта по протоколу OAI PMH с использованием API платформы COVID-19.рф.
- Данные проекта проиндексированы на платформах крупнейших международных интеграторов CORE и COVID-19 Open Research Gateway. Показано, что использование двуязычных поисковых запросов проекта на платформе международного агрегатора CORE позволяет существенно увеличить объем выдачи результатов поиска.
- Проект полностью отвечает требованиям, предъявляемым международным сообществом к репозиториям ОД. Количественные показатели проекта ставят его в один ряд с наиболее успешными национальными коллекциями COVID-публикаций зеленого ОД.
Авторы видят перспективы дальнейшего развития проекта в постоянном пополнении массива статей и надеются, что представленные детали создания и развития репозитория позволят разработчикам подобных проектов оптимизировать работу и использовать разработанные авторами методики и подходы.
1. Здесь и далее мы используем классификацию типов открытого доступа в последней версии платформы InCites компании Clarivate Analytics: https://incites.help.clarivate.com/Content/open-access.htm?Highlight=Open%20Access
2. #COVID19 (https://www.un.org/ru/coronavirus/un-tackling-%E2&%80%98infodemic%E2%80%99-misinformation-and-cybercrime-covid-19;https://naukatv.ru/video/775)
3. Confederation of Open Access Repositories, COAR: https://www.coar-repositories.org
4. cOAlitionS: https://www.coalition-s.org
5. Registry of Open Access Repositories ROAR http://roar.eprints.org/
6. UK Research and Innovation, https://www.ukri.org/ — объединение четырех финансирующих организаций Великобритании.
7. Там же.
8. COVID-19.рф: информация против пандемии — победитель конкурса. https://президентскиегранты.рф/public/application/item?id=D56ABDAE-2825-4D27-B7AA-A630F7D03346
9. OA definitions in Scopus: https://blog.scopus.com/posts/scopus-filters-for-open-access-type-and-55-million-more-oa-articles-17-million-in-total
10. OA definitions in WoS CC: https://incites.help.clarivate.com/Content/open-access.htm
11. ГК РФ Статья 1286.1. Открытая лицензия на использование произведения науки, литературы или искусства
12. В случае публикаций зеленого ОД, то есть, публикаций, которые уже размещены в каком-то репозитории или платформе ОД, речь идет о возможности повторного размещении публикации на других платформах
13. JISC, https://www.jisc.ac.uk/ — некоммерческая компания из Соединенного Королевства, которая предоставляет сетевые и ИТ-услуги, а также цифровые ресурсы для поддержки высших учебных заведений и исследований.
14. DOAJ: Directory of Open Access Journals https://doaj.org
15. https://conf.neicon.ru/index.php/science/online0621/
Приложение 1. Библиотека поисковых предписаний в международных базах данных научного цитирования (МНБД)
Исходный запрос, состоит из двух частей: русскоязычной и англоязычной, соединенных оператором ИЛИ/OR.
Запрос для варианта поиска в базе Web of Science
Русскоязычная часть запроса:
(TS=(«коронавирус тяжелого острого респираторного синдрома-2») OR (TS=(коронавирус*) AND TS=(«тяжелого острого респираторного синдрома-2»)) OR
(TS=(коронавирус*) AND TS=(тяжел* остр* респираторн* синдром*-2)) OR TS=(коронавирусн* инфекц*) OR TS=(коронавирус*) OR TS=(постковидн*) OR TS=(ковид*))
OR
Англоязычная часть запроса:
(TS=(COVID19) OR TS=(COVID2019) or TS=(COVID-19) OR TS=(COVID) or TS=(2019-nCoV) or (TS=(coronavirus*) AND TS=(disease-19)) or (TS=(coronavirus) AND TS=(«disease 2019»)) or TS=(SARS-CoV) or TS=(SARS-CoV-2) or TS=(HCoV-19) or TS=(«sars cov 2») or TS=(mesh:C000657245) or TS=(mesh:COVID-19) or TS=(mesh:D045169) or TS=(«2019 novel coronavirus»))
1.1. Поисковые предписания для МНБД Scopus
1.1.1. Поисковое предписание для получения всех российских COVID-статей
( ALL ( «коронавирус тяжелого острого респираторного синдрома» ) OR ( ALL ( коронавирус* ) AND ALL ( «тяжелого острого респираторного синдрома-2» ) ) OR ( ALL ( коронавирус* ) AND ALL ( тяжел* ) AND ALL ( остр* ) AND AL L ( респираторн* ) AND ALL ( синдром*-2 ) ) OR (ALL(коронавирусн* ) AND ALL ( инфекц* ) ) OR ALL ( коронавирус* ) OR ALL ( постковидн* ) OR ALL ( ковид* ) OR ( ALL ( пандеми* ) AND ALL ( кор онавирус* ) ) ) OR ( ALL ( covid19 ) OR ALL ( covid2019 ) OR ALL ( covid-19) OR ALL ( covid ) OR ALL ( 2019-ncov ) OR ( ALL ( coronavirus* ) AND ALL (disease ) ) OR ( ALL ( coronavirus* ) AND ALL ( disease 2019 ) ) OR ALL ( «sars-cov» ) OR ALL ( «sars-cov-2» ) OR ALL ( hcov-19 ) OR ALL ( «sars cov 2» ) OR ALL ( mers ) OR ALL ( mesh:c000657245 ) OR ALL ( mesh:covid-19 ) OR ALL ( mesh:d045169 ) OR ALL ( «novel coronavirus» ) OR ( ALL ( «severe acute respiratory syndrome» ) AND ALL ( «coronavirus « ) ) OR ALL ( «Severe Acute Respiratory Syndrome» ) ) AND AFFILCOUNTRY ( russian AND federation )
1.1.2. Поисковое предписание для получения всех российских закрытых COVID-статей
( ALL ( «коронавирус тяжелого острого респираторного синдрома» ) OR ( ALL ( коронавирус* ) AND ALL ( «тяжелого острого респираторного синдрома-2» ) ) OR ( ALL ( коронавирус* ) AND ALL ( тяжел* ) AND ALL ( остр* ) AND AL L ( респираторн* ) AND ALL ( синдром*-2 ) ) OR (ALL(коронавирусн* ) AND ALL ( инфекц* ) ) OR ALL ( коронавирус* ) OR ALL ( постковидн* ) OR ALL ( ковид* ) OR ( ALL ( пандеми* ) AND ALL ( кор онавирус* ) ) ) OR ( ALL ( covid19 ) OR ALL ( covid2019 ) OR ALL ( covid-19) OR ALL ( covid ) OR ALL ( 2019-ncov ) OR ( ALL ( coronavirus* ) AND ALL (disease ) ) OR ( ALL ( coronavirus* ) AND ALL ( disease 2019 ) ) OR ALL ( «sars-cov» ) OR ALL ( «sars-cov-2» ) OR ALL ( hcov-19 ) OR ALL ( «sars cov 2» ) OR ALL ( mers ) OR ALL ( mesh:c000657245 ) OR ALL ( mesh:covid-19 ) OR ALL ( mesh:d045169 ) OR ALL ( «novel coronavirus» ) OR ( ALL ( «severe acute respiratory syndrome» ) AND ALL ( «coronavirus « ) ) OR ALL ( «Severe Acute Respiratory Syndrome» ) ) AND AFFILCOUNTRY ( russian AND federation ) AND NOT OA ( all )
1.1.3. Поисковое предписание для получения всех российских открытых COVID-статей
( ALL ( «коронавирус тяжелого острого респираторного синдрома» ) OR ( ALL ( коронавирус* ) AND ALL ( «тяжелого острого респираторного синдрома-2» ) ) OR ( ALL ( коронавирус* ) AND ALL ( тяжел* ) AND ALL ( остр* ) AND AL L ( респираторн* ) AND ALL ( синдром*-2 ) ) OR (ALL(коронавирусн* ) AND ALL ( инфекц* ) ) OR ALL ( коронавирус* ) OR ALL ( постковидн* ) OR ALL ( ковид* ) OR ( ALL ( пандеми* ) AND ALL ( кор онавирус* ) ) ) OR ( ALL ( covid19 ) OR ALL ( covid2019 ) OR ALL ( covid-19) OR ALL ( covid ) OR ALL ( 2019-ncov ) OR ( ALL ( coronavirus* ) AND ALL (disease ) ) OR ( ALL ( coronavirus* ) AND ALL ( disease 2019 ) ) OR ALL ( «sars-cov» ) OR ALL ( «sars-cov-2» ) OR ALL ( hcov-19 ) OR ALL ( «sars cov 2» ) OR ALL ( mers ) OR ALL ( mesh:c000657245 ) OR ALL ( mesh:covid-19 ) OR ALL ( mesh:d045169 ) OR ALL ( «novel coronavirus» ) OR ( ALL ( «severe acute respiratory syndrome» ) AND ALL ( «coronavirus « ) ) OR ALL ( «Severe Acute Respiratory Syndrome» ) ) AND AFFILCOUNTRY (russian AND federation) AND OA ( all )
1.1.4. Поисковое предписание для получения всех закрытых российских COVID-статей и статей бронзового и зеленого открытого доступа
(( ALL ( «коронавирус тяжелого острого респираторного синдрома» ) OR ( ALL ( коронавирус* ) AND ALL ( «тяжелого острого респираторного синдрома-2» ) ) OR ( ALL ( коронавирус* ) AND ALL ( тяжел* ) AND ALL ( остр* ) AND AL L ( респираторн* ) AND ALL ( синдром*-2 ) ) OR (ALL(коронавирусн* ) AND ALL ( инфекц* ) ) OR ALL ( коронавирус* ) OR ALL ( постковидн* ) OR ALL ( ковид* ) OR ( ALL ( пандеми* ) AND ALL ( кор онавирус* ) ) ) OR ( ALL ( covid19 ) OR ALL ( covid2019 ) OR ALL ( covid-19) OR ALL ( covid ) OR ALL ( 2019-ncov ) OR ( ALL ( coronavirus* ) AND ALL (disease ) ) OR ( ALL ( coronavirus* ) AND ALL ( disease 2019 ) ) OR ALL ( «sars-cov» ) OR ALL ( «sars-cov-2» ) OR ALL ( hcov-19 ) OR ALL ( «sars cov 2» ) OR ALL ( mers ) OR ALL ( mesh:c000657245 ) OR ALL ( mesh:covid-19 ) OR ALL ( mesh:d045169 ) OR ALL ( «novel coronavirus» ) OR ( ALL ( «severe acute respiratory syndrome» ) AND ALL ( «coronavirus « ) ) OR ALL ( «Severe Acute Respiratory Syndrome» ) ) AND AFFILCOUNTRY ( russian AND federation ) ) AND NOT ( OA ( publisherfullgold ) OR OA ( publisherhybridgold ) )
1.2. Поисковые предписания для Web of Science Core Collection
1.2.1. Поисковое предписание для получения всех российских COVID-статей
(ALL= ( «коронавирус тяжелого острого респираторного синдрома») OR (ALL=(коронавирус* ) AND ALL=(«тяжелого острого респираторного синдрома-2» )) OR (ALL=(коронавирус*) AND ALL=( тяжел*) AND ALL=(остр*) AND ALL=(респираторн*) AN D ALL=(синдром*- 2 ) ) OR (ALL=(коронавирусн*) AND ALL=(инфекц* )) OR ALL= ( коронавирус*) OR ALL= (постковидн*) OR ALL= (ковид*) OR (ALL= (пандеми*) AND ALL= (коронавирус* ) )) OR ( ALL= (covid19 ) OR ALL= ( covid2019) OR ALL= (covid-19 ) OR ALL= ( covid ) OR ALL= ( 2019-ncov ) OR ( ALL=(coronavirus*) AND ALL= (disease ) ) OR ( ALL= ( coronavirus* ) AND ALL= ( disease 2019 ) ) OR ALL= ( «sars-cov» ) OR ALL= ( «sars-cov-2» ) OR ALL= ( hcov-19) OR ALL= («sars cov 2») OR ALL=(MERS) OR ALL= (mesh:c000657245) OR ALL= ( mesh:covid-19) OR ALL= ( mesh:d045169 ) OR ALL= ( «novel coronavirus») OR ( ALL= («severe acute respiratory syndrome» ) AND ALL= ( «coronavirus «) ) OR ALL= («Severe Acute Respiratory Syndrome» ) ) and CU=RUSSIA*
1.2.2. Поисковое предписание для получения всех российских COVID-статей закрытого доступа
ALL= ( «коронавирус тяжелого острого респираторного синдрома») OR (ALL=(коронавирус* ) AND ALL=(«тяжелого острого респираторного синдрома-2» )) OR (ALL=(коронавирус*) AND ALL=( тяжел*) AND ALL=(остр*) AND ALL=(респираторн*) AN D ALL=(синдром*- 2 ) ) OR (ALL=(коронавирусн*) AND ALL=(инфекц* )) OR ALL= ( коронавирус*) OR ALL= (постковидн*) OR ALL= (ковид*) OR (ALL= (пандеми*) AND ALL= (коронавирус* ) )) OR ( ALL= (covid19 ) OR ALL= ( covid2019) OR ALL= (covid-19 ) OR ALL= ( covid ) OR ALL= ( 2019-ncov ) OR ( ALL=(coronavirus*) AND ALL= (disease ) ) OR ( ALL= ( coronavirus* ) AND ALL= ( disease 2019 ) ) OR ALL= ( «sars-cov» ) OR ALL= ( «sars-cov-2» ) OR ALL= ( hcov-19) OR ALL= («sars cov 2») OR ALL=(MERS) OR ALL= (mesh:c000657245) OR ALL= ( mesh:covid-19) OR ALL= ( mesh:d045169 ) OR ALL= ( «novel coronavirus») OR ( ALL= («severe acute respiratory syndrome» ) AND ALL= ( «coronavirus «) ) OR ALL= («Severe Acute Respiratory Syndrome» ) ) and CU=RUSSIA*
Refined by: Open Access: ( NOT OPEN ACCESS )
1.2.3. Поисковое предписание для получения всех российских COVID-статей открытого доступа
ALL= ( «коронавирус тяжелого острого респираторного синдрома») OR (ALL=(коронавирус* ) AND ALL=(«тяжелого острого респираторного синдрома-2» )) OR (ALL=(коронавирус*) AND ALL=( тяжел*) AND ALL=(остр*) AND ALL=(респираторн*) AN D ALL=(синдром*- 2 ) ) OR (ALL=(коронавирусн*) AND ALL=(инфекц* )) OR ALL= ( коронавирус*) OR ALL= (постковидн*) OR ALL= (ковид*) OR (ALL= (пандеми*) AND ALL= (коронавирус* ) )) OR ( ALL= (covid19 ) OR ALL= ( covid2019) OR ALL= (covid-19 ) OR ALL= ( covid ) OR ALL= ( 2019-ncov ) OR ( ALL=(coronavirus*) AND ALL= (disease ) ) OR ( ALL= ( coronavirus* ) AND ALL= ( disease 2019 ) ) OR ALL= ( «sars-cov» ) OR ALL= ( «sars-cov-2» ) OR ALL= ( hcov-19) OR ALL= («sars cov 2») OR ALL=(MERS) OR ALL= (mesh:c000657245) OR ALL= ( mesh:covid-19) OR ALL= ( mesh:d045169 ) OR ALL= ( «novel coronavirus») OR ( ALL= («severe acute respiratory syndrome» ) AND ALL= ( «coronavirus «) ) OR ALL= («Severe Acute Respiratory Syndrome» ) ) and CU=RUSSIA*
Refined by: Open Access: (OPEN ACCESS )
1.2.4. Поисковое предписание для получения всех российских COVID-статей золотого и гибридного открытого доступа
ALL= ( «коронавирус тяжелого острого респираторного синдрома») OR (ALL=(коронавирус* ) AND ALL=(«тяжелого острого респираторного синдрома-2» )) OR (ALL=(коронавирус*) AND ALL=( тяжел*) AND ALL=(остр*) AND ALL=(респираторн*) AN D ALL=(синдром*- 2 ) ) OR (ALL=(коронавирусн*) AND ALL=(инфекц* )) OR ALL= ( коронавирус*) OR ALL= (постковидн*) OR ALL= (ковид*) OR (ALL= (пандеми*) AND ALL= (коронавирус* ) )) OR ( ALL= (covid19 ) OR ALL= ( covid2019) OR ALL= (covid-19 ) OR ALL= ( covid ) OR ALL= ( 2019-ncov ) OR ( ALL=(coronavirus*) AND ALL= (disease ) ) OR ( ALL= ( coronavirus* ) AND ALL= ( disease 2019 ) ) OR ALL= ( «sars-cov» ) OR ALL= ( «sars-cov-2» ) OR ALL= ( hcov-19) OR ALL= («sars cov 2») OR ALL=(MERS) OR ALL= (mesh:c000657245) OR ALL= ( mesh:covid-19) OR ALL= ( mesh:d045169 ) OR ALL= ( «novel coronavirus») OR ( ALL= («severe acute respiratory syndrome» ) AND ALL= ( «coronavirus «) ) OR ALL= («Severe Acute Respiratory Syndrome» ) ) and CU=RUSSIA*
Refined by: Open Access: ( DOAJ Gold OR Other Gold )
1.3. Поисковые предписания для Web of Science Russian Science Citation Index
1.3.1. Поисковое предписание для получения всех российских COVID-статей
(TS= ( «коронавирус тяжелого острого респираторного синдрома») OR (TS=(коронавирус* ) AND TS=(«тяжелого острого респираторного синдрома-2» )) OR (TS=(коронавирус*) AND TS=(тяжел*) AND TS=(остр*) AND TS=(респиратор н*) AND TS=(синдром*-2 ) ) OR (TS= (коронавирусн*) AND TS=(инфекц* )) OR TS= ( коронавирус* ) OR TS= ( постковидн* ) OR TS= ( ковид* ) OR (TS= ( пандеми*) AND TS= ( коронавирус* ) )) OR ( TS= ( covid19 ) OR TS= ( covid2019 ) OR TS=(covid-19 ) OR TS= ( covid ) OR TS= ( 2019-ncov ) OR ( TS= ( coronavirus* ) AND TS=(disease ) ) OR ( TS= ( coronavirus* ) AND TS= ( disease 2019 ) ) OR TS= ( «sars-cov» ) OR TS= ( «sars-cov-2» ) OR TS= ( hcov-19 ) OR TS= ( «sars cov 2») OR TS=(MERS) OR TS= ( mesh:c000657245 ) OR TS= ( mesh:covid-19) OR TS=(mesh:d045169 ) OR TS= ( «novel coronavirus» ) OR ( TS= ( «severe acute respiratory syndrome» ) AND TS= ( «coronavirus « ) ) OR TS= («Severe Acute Respiratory Syndrome» ) ) and CU=RUSSIA*
1.3.2. Поисковое предписание для получения всех российских COVID-статей открытого доступа
(TS= ( «коронавирус тяжелого острого респираторного синдрома») OR (TS=(коронавирус* ) AND TS=(«тяжелого острого респираторного синдрома-2» )) OR (TS=(коронавирус*) AND TS=(тяжел*) AND TS=(остр*) AND TS=(респиратор н*) AND TS=(синдром*-2 ) ) OR (TS= (коронавирусн*) AND TS=(инфекц* )) OR TS= ( коронавирус* ) OR TS= ( постковидн* ) OR TS= ( ковид* ) OR (TS= ( пандеми*) AND TS= ( коронавирус* ) )) OR ( TS= ( covid19 ) OR TS= ( covid2019 ) OR TS=(covid-19 ) OR TS= ( covid ) OR TS= ( 2019-ncov ) OR ( TS= ( coronavirus* ) AND TS=(disease ) ) OR ( TS= ( coronavirus* ) AND TS= ( disease 2019 ) ) OR TS= ( «sars-cov» ) OR TS= ( «sars-cov-2» ) OR TS= ( hcov-19 ) OR TS= ( «sars cov 2») OR TS=(MERS) OR TS= ( mesh:c000657245 ) OR TS= ( mesh:covid-19) OR TS=(mesh:d045169 ) OR TS= ( «novel coronavirus» ) OR ( TS= ( «severe acute respiratory syndrome» ) AND TS= ( «coronavirus « ) ) OR TS= («Severe Acute Respiratory Syndrome» )
Refined by: Open Access: (OPEN ACCESS )
1.3.3. Поисковое предписание для получения всех российских COVID-статей закрытого доступа
(TS= ( «коронавирус тяжелого острого респираторного синдрома») OR (TS=(коронавирус* ) AND TS=(«тяжелого острого респираторного синдрома-2» )) OR (TS=(коронавирус*) AND TS=(тяжел*) AND TS=(остр*) AND TS=(респиратор н*) AND TS=(синдром*-2 ) ) OR (TS= (коронавирусн*) AND TS=(инфекц* )) OR TS= ( коронавирус* ) OR TS= ( постковидн* ) OR TS= ( ковид* ) OR (TS= ( пандеми*) AND TS= ( коронавирус* ) )) OR ( TS= ( covid19 ) OR TS= ( covid2019 ) OR TS=(covid-19 ) OR TS= ( covid ) OR TS= ( 2019-ncov ) OR ( TS= ( coronavirus* ) AND TS=(disease ) ) OR ( TS= ( coronavirus* ) AND TS= ( disease 2019 ) ) OR TS= ( «sars-cov» ) OR TS= ( «sars-cov-2» ) OR TS= ( hcov-19 ) OR TS= ( «sars cov 2») OR TS=(MERS) OR TS= ( mesh:c000657245 ) OR TS= ( mesh:covid-19) OR TS=(mesh:d045169 ) OR TS= ( «novel coronavirus» ) OR ( TS= ( «severe acute respiratory syndrome» ) AND TS= ( «coronavirus « ) ) OR TS= («Severe Acute Respiratory Syndrome» )
Refined by: Open Access: (NOT OPEN ACCESS )
1.3.4. Поисковое предписание для получения всех российских COVID-статей золотого и гибридного открытого доступа
(TS= ( «коронавирус тяжелого острого респираторного синдрома») OR (TS=(коронавирус* ) AND TS=(«тяжелого острого респираторного синдрома-2» )) OR (TS=(коронавирус*) AND TS=(тяжел*) AND TS=(остр*) AND TS=(респиратор н*) AND TS=(синдром*-2 ) ) OR (TS= (коронавирусн*) AND TS=(инфекц* )) OR TS= ( коронавирус* ) OR TS= ( постковидн* ) OR TS= ( ковид* ) OR (TS= ( пандеми*) AND TS= ( коронавирус* ) )) OR ( TS= ( covid19 ) OR TS= ( covid2019 ) OR TS=(covid-19 ) OR TS= ( covid ) OR TS= ( 2019-ncov ) OR ( TS= ( coronavirus* ) AND TS=(disease ) ) OR ( TS= ( coronavirus* ) AND TS= ( disease 2019 ) ) OR TS= ( «sars-cov» ) OR TS= ( «sars-cov-2» ) OR TS= ( hcov-19 ) OR TS= ( «sars cov 2») OR TS=(MERS) OR TS= ( mesh:c000657245 ) OR TS= ( mesh:covid-19) OR TS=(mesh:d045169 ) OR TS= ( «novel coronavirus» ) OR ( TS= ( «severe acute respiratory syndrome» ) AND TS= ( «coronavirus « ) ) OR TS= («Severe Acute Respiratory Syndrome» )
Refined by: Open Access: (DOAJ Gold OR Other Gold )
1.4. Поисковое предписание для получения всех российских COVID-статей в The Lens
Поисковое предписание состоит из двух частей. Массив закрытых публикаций получается вычитанием второго результата из первого (#1 NOT #2).
#1 Scholarly Works (1,920) = ((COVID OR «SARS-2» OR SARS-COV-2 OR SARS-COV OR коронавир* OR 2019-nCoV OR HCoV-19 OR mesh:C000657245 OR (mesh:COVID-19) OR mesh:D045169 OR (novel coronavirus) OR («severe acute respiratory syndrome» AND «coronavirus») OR covid19 OR covid2019 OR covid-19 OR 2019-ncov OR ( coronavirus* AND «disease-19» ) OR ( coronavirus AND «disease 2019» ) OR hcov-19 OR «novel coronavirus» OR ( «Severe Acute Respiratory Syndrome» ) OR ( «коронавирус тяжелого острого респираторного синдрома» ) OR ( коронавирусн* AND инфекц* ) OR ( коронавирус* ) OR ( постковидн* ) OR ( ковид* ) OR ( пандеми* AND коронавирус* ) OR (pandemic* AND (COVID OR SARS-2 OR SARS-COV-2 OR SARS-COV OR коронавир* OR 2019-nCoV OR HCoV-19)))) AND author.affiliation.grid.address.country_code:RU
#2 Scholarly Works (1,025) = (((COVID OR «SARS-2» OR SARS-COV-2 OR SARS-COV OR коронавир* OR 2019-nCoV OR HCoV-19 OR mesh:C000657245 OR (mesh:COVID-19) OR mesh:D045169 OR (novel coronavirus) OR («severe acute respiratory syndrome» AND «coronavirus») OR covid19 OR covid2019 OR covid-19 OR 2019-ncov OR ( coronavirus* AND «disease-19» ) OR ( coronavirus AND «disease 2019» ) OR hcov-19 OR «novel coronavirus» OR ( «Severe Acute Respiratory Syndrome» ) OR ( «коронавирус тяжелого острого респираторного синдрома» ) OR ( коронавирусн* AND инфекц* ) OR ( коронавирус* ) OR ( постковидн* ) OR ( ковид* ) OR ( пандеми* AND коронавирус* ) OR (pandemic* AND (COVID OR SARS-2 OR SARS-COV-2 OR SARS-COV OR коронавир* OR 2019-nCoV OR HCoV-19)))) AND author.affiliation.grid.address.country_code:RU AND (open_access.colour:((gold OR hybrid)) OR open_access.license:(( cc0 OR cc-by OR implied-oa OR cc-by-nc-sa OR CC BY OR CC0 OR cc-by-nc OR CC BY OR CC BY-NC OR CC BY OR CC BY-NC-ND OR cc-by-nc-nd ))))
1.5. Алгоритм поиска и выгрузки российских COVID-публикаций платформы Dimensions
Выборка российских COVID-публикаций открытого доступа проводилась на специально созданном Dimensions массиве данных, размещенных в ОД: https://www.dimensions.ai/covid19/ Тот же массив загружен в инструмент от GOOGLE — COVID-19 data on BigQuery по адресу https://console.cloud.google.com/marketplace/product/digitalscience-public/covid-19-dataset-dimensions?pli=1&project=neicon-covid
Для поиска российских публикаций в этом массиве был использован запрос на языке SQL: SQL SELECT * FROM covid-19-dimensions-ai.data.publications WHERE «RU» IN UNNEST(research_org_countries)
Приложение 2. Определение правового статуса статей закрытого доступа с использованием API к платформе проекта Sherpa/RoMEO
2.1. Использованные алгоритмы определения правового статуса массива статей закрытого доступа с использованием API к платформе проекта Sherpa/RoMEO
Задача определения правового статуса массива статей была решена алгоритмическим образом с использованием API. Поиск в базе данных Sherpa/RoMEO проводился по ISSN журнала с использованием запроса вида: https://v2.sherpa.ac.uk/cgi/retrieve/cgi/retrieve?item-type=publication&api-key=api_key&format=json&filter=[[“issn”,”equals”,”ISSN”]].
Здесь «ISSN» — конкретное значение ISSN.
В ответе на запрос такого вида в поле объекта «items» выгружается массив отвечающих поисковому условию изданий (журналов), в нашем случае — из одного элемента — данных журнала с соответствующим ISSN=“ISSN” в формате JSON. Для удобства обработки, массив записей с данными по каждому журналу был загружен в коллекцию системы управления базой данных, СУБД MongoDB, дальнейшая обработка проводилась средствами этой СУБД. Список полей метаданных в Sherpa/Romeo приведен ниже.
Политики открытого доступа издательства описаны в поле «publisher_policy». Из множества политик выбиралась политика «по умолчанию», относящаяся к статьям закрытого доступа с использованием фильтра на значение в поле «internal_moniker» = «Default Policy». В этой политике прежде всего проверялось значение поля «open_access_prohibited» значение «no» указывает на то, что издатель разрешает публикацию материалов в открытом доступе. Далее анализировался массив «permitted_oa», содержащий сведения об условиях открытого доступа по отношению к разным версиям статьи. Массив вариантов фильтровался по условию наличия разрешений на публикацию материалов на любом сайте и/или любом или тематическом некоммерческом репозитории без взимания дополнительной платы за перевод в открытый доступ (APC) и отсутствии или достаточно коротком периоде эмбарго с соблюдением следующих условий:
- Поле «location.location» содержит “Non-Commercial Repository”, или “Non-Commercial Subject Repository”, или “Any Repository”, или “Subject Repository”, или “Any Website”.
- Значение поля «additional_oa_fee» равно “no”.
- Значение поля «embargo» не определено или разница между текущей датой и датой публикации, приведенная к единицам, указанным в субполе units, меньше значения, указанного в субполе amount.
В случае реализации одного из двух последних вариантов выбирался наиболее предпочтительный из них по версии статьи, содержащейся в поле article_version: “published”, “accepted”, “submitted”.
Результатом выполнения этого алгоритма является определение возможности публикации статьи на сайте проекта с уточнением наиболее подходящего варианта документа — опубликованного в журнале, прошедшего рецензирование или отправленного в редакцию.
Рассмотрим конкретный пример записи из сервиса Sherpa/RoMEO, полученной по запросу посредством API для ISSN 1947-5543 в формате JSON для определения возможности публикации в репозитории статьи Allocca C.M., Bledsoe M.J., Albert M., Anisimov S.V., Bravo E., Castelhano M.G., Cohen Y., De Wilde M., Furuta K., Kozlakidis Z., Martin D., Martins A. Biobanking in the COVID-19 Era and Beyond: Part 1. How Early Experiences Can Translate into Actionable Wisdom. Biopreservation and Biobanking. 2020;18(6):533–546, опубликованной в декабре 2020 г.
Для этого журнала определена всего одна политика по умолчанию — имеется один элемент в поле publisher_policy с значением поля internal_moniker = “Default Policy”. В этой политике описано 6 вариантов открытого доступа (6 элементов в поле permitted_oa). Из этих элементов под критерий отсутствия дополнительной платы и подходящее место размещения полного текста подходят два первых элемента, касающихся версий submitted и accepted. Accepted версия для нас предпочтительней, так как эта версия статьи содержит правки, сделанные в процедуре рецензирования и научного редактирования. Требования описаны в соответствующих элементах записи:
{ «additional_oa_fee» : «no», «embargo» : {«units» : «months»,
«amount» : NumberInt(12),
},
«location» : {
«location» : [
«institutional_repository»,
«non_commercial_repository»
]
},
«article_version» : [
«accepted»
],
«conditions» : [
«Set statement to accompany deposit»,
«Must link to published article with DOI»,
«Must acknowledge published source with citation»,
«Must not be updated or replaced with article of record unless author pays for Open Access»
]
}
Таким образом, описанный выше алгоритм определяет, что рассматриваемая статья может быть размещена в репозитории в версии accepted (после рецензирования) с периодом эмбарго 12 месяцев, то есть не ранее декабря 2021 г., при выполнении следующих условий: размещенный текст должен сопровождаться заявлением установленного образца; должен быть обеспечен переход к опубликованной статье, имеющей DOI; должна быть приведена ссылка на первоисточник; размещенный текст не может быть заменен на опубликованную версию, до тех пор, пока автор не внесет плату за публикацию статьи в открытом доступе.
2.2. Анализ полного массива данных платформы Sherpa/RoMEO
Для анализа всего массива данных, выгруженных из Sherpa/RoMEO, и последующей привязки их к метаданным статей был оставлен программный запрос на языке пакета «Математика», позволяющий для любого заданного журнала выводить заданный набор переменных, характеризующих политику издателей по отношению к самоархивированию (размещению в зеленом ОД).
На основе разработанной технологии мониторинга платформы elpub и МНБД была произведена выгрузка метаданных всех COVID-статей закрытого и бронзового доступа, а также статей зеленого ОД.
По идентификаторам журналов в метаданных была произведена привязка метаданных всех COVID-статей закрытого доступа к метаданным о политике этих журналов, полученным на платформе SHERPA/RoMEO. Привязка производилась следующим образом.
Для определения правового статуса статей мы использовали данные о политике издателей всех журналов, в которых опубликованы статьи, полученные в результате мониторинга COVID-статей закрытого доступа в МНБД, и их метаданные. При этом обязательными полями в выгрузке метаданных были определены поле ISSN журнала и поле названия журнала «title». Эти поля были выбраны, поскольку они присутствуют в выгрузке метаданных всех массивов закрытых статей, полученных в результате мониторинга исследованных МНБД.
Привязка метаданных конкретной статьи к метаданным с информацией о ее правовом статусе осуществлялась по ISSN с помощью функции VLOOCUP языка программирования excel. Поле «Название журнала» использовалось для сравнительной проверки значений этого поля. Политики издателей определялись для всех трех возможных версий статьи: submitted, accepted и published.
Для каждого анализируемого журнала из перечня метаданных о политике издания были выбраны значения переменной version, location, embargo, licence. В том случае когда для одного и того же ISSN (названия) журнала для разных значений переменной location издателем были определены разные значения переменных embargo и license, эта информация указывалась в отдельной строке. По этой причине число записей о возможных издательских политиках превышало число исследованных журналов.
2.3. Поля метаданных для описания периодического научного издания в базе данных платформы SHERPA/RoMEO
- id integer: Sherpa идентификатор издания;
- title — заголовок издания с указанием языка (двухбуквенный код языка);
- issn — цифровой идентификатор серийного издания. Возможные значения значение (‘print’, ‘electronic’, ‘legacy’);
- type — тип издания, возможные значения (‘journal’, ‘conference_proceedings’, ‘monographic_series’);
- URL: URL издания;
- list_in_doaj: издание присутствует в директории журналов открытого доступа DOAJ. Возможные значения ‘yes’, ‘no’;
- publisher: издатель этого журнала. Доступны поля: id, title, issns, type, uri;
- publisher_policy — перечень возможных OA доступных для статей, возможные значения: allowed_oa, open_access_prohibited.
2.4. Поля метаданных для описания политики издателей
- id integer — идентификатор объекта в Sherpa;
- internal_moniker text — имя, используемое внутри редакционной группы Sherpa;
- URL-address — URL-адрес политики;
- open_access_prohibited — запрещает ли политика открытый доступ? Возможные значения: ‘yes’, ‘no’;
- publisher — издатель, которому принадлежит эта политика;
- public_count integer — количество публикаций, к которым привязана эта политика;
- allowed_oa — открытый доступ, разрешенный этой политикой.
- prerequisites — предварительные требования, возможные значения:
‘requires_publisher_permission’, ‘when_required_by_funder’, ‘when_required_by_law’, ‘when_required_by_institution’, ‘when_research_article’; - prerequisite_funders — спонсор, финансирующая организация prerequisite_funders. Возможные подполя: funder_metadata (id, name, url, country, description, notes, groups, identifiers), system_metadata (id, uri);
- article_version — к каким версиям статьи относится информация, возможные значения: submitted — ‘подано’, accepted — ‘принято’, published ‘опубликовано’;
- location — место, где статья может быть открыта для доступа. Возможные значения: ‘Acaedimic social network’ — ‘академическая социальная сеть’, ‘any repository’ — ‘любой репозиторий’, ‘any website’ — ‘любой веб-сайт’, ‘author homepage’ — ‘домашняя страница автора’, ‘funder designated location’ — ‘место, определенное спонсором’, ‘inctitutional repository’ — ‘институциональный репозиторий’, ‘institutional website’ — ‘институциональный веб-сайт’, ‘named academic social network’ — ‘поименованная академическая социальная сеть’, ‘named repository’ — ‘поименованный репозиторий’, ‘non commercial repository’ — ‘некоммерческий репозиторий’, ‘non commercial social network’ — ‘некоммерческая социальная сеть’, ‘non commercial subject repository’ — ‘некоммерческий предметный репозиторий’, — ‘non commercial website’ — ‘некоммерческий_вебсайт’, ‘preprint repository’ — ‘репозиторий препринтов’, ‘subject repository’ — ‘предметный репозиторий’, ‘this_journal’ — ‘этот журнал’ — доступ, предоставляется самим журналом (публикация с открытым доступом).
Примечания: институциональный_репозиторий может быть некоммерческим репозиторием; если установлено any website, разрешено любое местоположение. - embargo — эмбарго: требуется эмбарго. Указывается количество — целое значение единиц (‘дни’, ‘недели’, ‘месяцы’, ‘годы’);
- license — лицензия (например, лицензия creative commons (СС), разрешающая неограниченное дальнейшее использование статьи без запроса дополнительного разрешения от владельцев авторских прав);
- copyright owner — владелец авторского права, возможные значения: ‘авторы’, ‘авторы учреждение’, ‘журнал’, ‘научное общество’, ‘издатели’, ‘shared authors and journal’, ‘shared authors and learned society’, ‘shared authors and publishers’, ‘shared authors institution’;
- additional oa fee — нужна ли дополнительная плата, необходимая для перевода в ОД. Возможные значения: ‘yes’, ‘no’;
Список литературы
1. Key competence for Europe. Report of the Symposium Berne, Switzerland 27–30 March, 1996 Strasburg: Council for Cultural Cooperation a Secondary Education for Europe; 1997. Available at: https://files.eric.ed.gov/fulltext/ED407717.pdf
2. Information for All Program (IFAP). UNESCO. Available at: https://en.unesco.org/programme/ifap
3. COAR Recommendations for COVID-19 resources in repositories. COAR; 2020. Available at: https://www.coar-repositories.org/news-updates/covid19-recommendations/
4. cOAlition S publishes updated criteria for Transformative Journals. Plan S; 2020. Available at: https://www.coalition-s.org/coalition-spublishes-updated-criteria-for-transformativejournals/.
5. Plan S. Making full and immediate Open Access a reality. Plan S. Available at: https://www.coalition-s.org/ (accessed: 10.01.2022).
6. Shaping our open access policy. UK Research and Innovation. Available at: https://www.ukri.org/what-we-offer/supporting-healthy-research-andinnovation-culture/open-research/open-accesspolicies-review/ (accessed: 10.01.2022).
7. UNESCO Recommendation on Open Science. UNESCO; 2021. Available at: https://unesdoc.unesco.org/ark:/48223/pf0000379949
8. Emery C., Lucraft M., Monaghan J., Stuart D., Winter S. Going for gold: exploring the reach and impact of Gold open access articles in hybrid journals. Springer Nature; 2021. Available at: https://www.springernature.com/gp/open-research/journalsbooks/journals/going-for-gold-reach-and-impact. https://doi.org/10.6084/m9.figshare.16860229.v2
9. Разумова И.К. Пандемия COVID-19 и режим самоизоляции: влияние на библиометрические показатели и использование научных публикаций. Часть I. Число и структура публикаций. Наука и научная информация. 2020;3(2–3):166–187. https://doi.org/10.24108/2658-3143-2020-3-2-3-166-187
10. Разумова И.К. Пандемия COVID-19 и режим самоизоляции: влияние на библиометрические показатели и использование научных публикаций. Часть II. Показатели цитирования и использования. Наука и научная информация. 2020;3(2– 3):188–206. https://doi.org/10.24108/2658-3143-2020-3-2-3-188-206
11. Piwowar H., Priem J., Larivière V., Alperin J.P., Matthias L., Norlander B., et al. The state of OA: a large-scale analysis of the prevalence and impact of open access articles. Peer J. 2018;6:e4375. https://doi.org/10.7717/peerj.4375
12. Разумова И.К. Целесообразность перехода российской централизованной и национальной подписки на модель Publish & Read. Научное издание международного уровня — 2019: стратегия и тактика управления и развития: материалы 8-й Международ. науч.-практ. конф., Москва, 23-26 апреля 2019 г. Екатеринбург: Изд-во Урал. ун-та; 2019. С. 85–96. https://doi.org/10.24069/konf-23-26-04-2019.13
13. Hoy M.B. New tools for finding full-text articles faster: Kopernio, nomad, unpaywall, and more. Medical Reference Services Quarterly. 2019;38(3):287–292. https://doi.org/10.1080/02763869.2019.1629215
14. Ferguson N., Laydon D., Nedjati Gilani G., Imai N., Ainslie K., Baguelin M., et al. Report 9: Impact of non-pharmaceutical interventions (NPIs) to reduce COVID19 mortality and healthcare demand; 2020. Available at: https://spiral.imperial.ac.uk/bitstream/10044/1/77482/14/2020-03-16-COVID19-Report-9.pdf
15. Pakpour A.H., Griffiths,M.D. The fear of COVID-19 and its role in preventive behaviors. Journal of Concurrent Disorders. 2020;2(1):58–63.
16. Chen X. Journal article retrieval in an age of Open Access: how journal indexes indicate Open Access articles. Journal of Web Librarianship. 2013;7(3):243– 254. https://doi.org/10.1080/19322909.2013.795426
17. Swan A. Policy guidelines for the development and promotion of open access. UNESCO; 2012. Available at: https://unesdoc.unesco.org/ark:/48223/pf0000215863
18. Разумова И.К. Глобальные изменения в системе научной коммуникации: государственные и общественные инициативы 2000+. Режим доступа: https://disk.yandex.ru/i/vvNRxqK1stq-DA (дата доступа: 11.04.2022).
19. Byford S. Wiley supplies full-text open access articles to Publications Router; 2021. Available at: https://research.jiscinvolve.org/wp/2021/04/13/wiley-supplies-full-text-open-access-articles-topublications-router/
20. Шварцман М.Е. Применение ERS для создания репозитория COVID-19.рф. Режим доступа: https://conf.neicon.ru/materials/84-Overseas2021/20210917-12-Shvartsman.pptx
21. Repanovici A., Barsan I.M. Integration of SHERPA/ RoMEO in institutional digital repositories to address the uncertainty of copyright. Malaysian Journal of Library and Information Science. 2015;20(1):29–45.
22. Ashley D.R. Sergiadis. Evaluating Zotero, SHERPA/ RoMEO, and Unpaywall in an institutional repository workflow. Journal of Electronic Resources Librarianship. 2019;31(3):152–176. https://doi.org/10.1080/1941126X.2019.1635396
23. Curry C.L. SHERPA services and SHERPA/RoMEO. Journal of Electronic Resources in Medical Libraries. 2017;14(3–4):135–138. https://doi.org/10.1080/15424065.2017.1368424
24. Разумова И.К. Правовые вопросы пополнения репозиториев. Политики издателей по отношению к институциональным репозиториям и другим открытым платформам: проект Sherpa/ Romeo. Режим доступа: https://conf.neicon.ru/materials/85-online0621/20210622-Razumova.pdf (дата доступа: 11.04.2022).
25. Косяков Д.В. Использование API Sherpa/RoMEO для пополнения репозиториев. Режим доступа: https://conf.neicon.ru/materials/85-online0621/20210622-Kosyakov.pdf (дата доступа: 11.04.2022).
Об авторах
М. М. ЗельдинаРоссия
Марина М. Зельдина, координатор проекта, ул. Летниковская, д. 4, стр. 5, офис 2.4, г. Москва, 115114;
главный специалист, ул. Шкулева, д. 9, к. 2, г. Москва, 192263
Д. В. Косяков
Россия
Денис В. Косяков, руководитель проекта, ул. Летниковская, д. 4, стр. 5, офис 2.4, г. Москва, 115114;
к. ф.-м. н., научный сотрудник, ул. Добролюбова, д. 20А, г. Москва, 127254
А. Ю. Кузнецов
Россия
Александр Ю. Кузнецов, исполнительный директор,
ул. Летниковская, д. 4, стр. 5, офис 2.4, г. Москва, 115114
В. В. Лебедев
Россия
Владимир В. Лебедев, ведущий программист, ул. Летниковская, д. 4, стр. 5, офис 2.4, г. Москва, 115114;
системный программист, ул. Шкулева, д. 9, к. 2, г. Москва, 192263
А. В. Малышев
Испания
Андрей В. Малышев, к. ф.-м. н., Ph.D., Profesor Contratado Doctor, Plaza de Ciencias, 1, Ciudad Universitaria, 28040, Madrid;
младший научный сотрудник, ул. Политехническая., д. 26, г. Санкт-Петербург, 194021
И. К. Разумова
Россия
Ирина К. Разумова, к. ф.-м. н., заместитель директора по науке,
ул. Летниковская, д. 4, стр. 5, офис 2.4, г. Москва, 115114
М. Е. Шварцман
Россия
Михаил Е. Шварцман, заместитель директора, ул. Летниковская, д. 4, стр. 5, офис 2.4, г. Москва, 115114;
главный специалист, ул. Воздвиженка, д. 3/5, г. Москва, 190019
Рецензия
Для цитирования:
Зельдина М.М., Косяков Д.В., Кузнецов А.Ю., Лебедев В.В., Малышев А.В., Разумова И.К., Шварцман М.Е. COVID-19.рф: информация против пандемии. Задачи и результаты проекта. Наука и научная информация. 2022;5(1):20-43. https://doi.org/10.24108/2658-3143-2022-5-1-20-43
For citation:
Zeldina M.M., Kosyakov D.V., Kuznetsov A.Yu., Lebedev V.V., Malyshev A.V., Razumova I.K., Shvartsman M.E. COVID-19.rf: Information Against Pandemics: Project Goals and Results. Scholarly Research and Information. 2022;5(1):20-43. (In Russ.) https://doi.org/10.24108/2658-3143-2022-5-1-20-43