Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz
O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucion...
Saved in:
Main Authors: | , , |
---|---|
Format: | Book |
Published: |
Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz),
2017-11-01T00:00:00Z.
|
Subjects: | |
Online Access: | Connect to this object online. |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
MARC
LEADER | 00000 am a22000003u 4500 | ||
---|---|---|---|
001 | doaj_89f0f8fb731646ebb0adf8f9f78af22d | ||
042 | |a dc | ||
100 | 1 | 0 | |a Marcel de Moraes Pedroso |e author |
700 | 1 | 0 | |a Jefferson da Costa Lima |e author |
700 | 1 | 0 | |a Vinicius Belchior Assef Neto |e author |
245 | 0 | 0 | |a Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz |
260 | |b Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz), |c 2017-11-01T00:00:00Z. | ||
500 | |a 10.29397/reciis.v11i0.1417 | ||
500 | |a 1981-6278 | ||
520 | |a O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundação fomentam um desafio metodológico relacionado a classificação e recuperação dos objetos digitais depositados e a governança dos metadados registrados pelas comunidades que integram o repositório. Em 2016 o mecanismo de busca do Arca contabilizou mais de 400 mil consultas. É necessário um sistema de Recuperação da Informação que atenda as especificidades de indexação do repositório e a crescente demanda por informação por parte dos usuários internos e externos a Fiocruz. Neste trabalho propomos a utilização de ferramentas de Ciência de Dados, especialmente técnicas de Mineração de Dados e Aprendizagem de Máquina com o objetivo de aprimorar a Recuperação da Informação, por meio da classificação automática de objetos digitais depositados no Arca e o desenvolvimento e disponibilização de sistema de RI baseado em métricas de qualidade relacionadas aos conceitos de precisão e revocação. | ||
546 | |a EN | ||
546 | |a ES | ||
546 | |a PT | ||
690 | |a Ciência de Dados | ||
690 | |a Armazenamento e Recuperação da Informação | ||
690 | |a Mineração de Dados | ||
690 | |a Aprendizagem de Máquina | ||
690 | |a Repositórios Institucionais. | ||
690 | |a Communication. Mass media | ||
690 | |a P87-96 | ||
690 | |a Public aspects of medicine | ||
690 | |a RA1-1270 | ||
655 | 7 | |a article |2 local | |
786 | 0 | |n RECIIS, Vol 11 (2017) | |
787 | 0 | |n https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417 | |
787 | 0 | |n https://doaj.org/toc/1981-6278 | |
856 | 4 | 1 | |u https://doaj.org/article/89f0f8fb731646ebb0adf8f9f78af22d |z Connect to this object online. |