Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz

O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucion...

Full description

Saved in:
Bibliographic Details
Main Authors: Marcel de Moraes Pedroso (Author), Jefferson da Costa Lima (Author), Vinicius Belchior Assef Neto (Author)
Format: Book
Published: Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz), 2017-11-01T00:00:00Z.
Subjects:
Online Access:Connect to this object online.
Tags: Add Tag
No Tags, Be the first to tag this record!

MARC

LEADER 00000 am a22000003u 4500
001 doaj_89f0f8fb731646ebb0adf8f9f78af22d
042 |a dc 
100 1 0 |a Marcel de Moraes Pedroso  |e author 
700 1 0 |a Jefferson da Costa Lima  |e author 
700 1 0 |a Vinicius Belchior Assef Neto  |e author 
245 0 0 |a Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz 
260 |b Instituto de Comunicação e Informação Científica e Tecnológica em Saúde (Icict) da Fundação Oswaldo Cruz (Fiocruz),   |c 2017-11-01T00:00:00Z. 
500 |a 10.29397/reciis.v11i0.1417 
500 |a 1981-6278 
520 |a O repositório institucional Arca é o principal instrumento de realização do acesso aberto na Fundação Oswaldo Cruz, tendo como missão reunir, hospedar, preservar, disponibilizar e dar visibilidade à produção intelectual da Instituição. A diversidade temática e a complexidade institucional da Fundação fomentam um desafio metodológico relacionado a classificação e recuperação dos objetos digitais depositados e a governança dos metadados registrados pelas comunidades que integram o repositório. Em 2016 o mecanismo de busca do Arca contabilizou mais de 400 mil consultas. É necessário um sistema de Recuperação da Informação que atenda as especificidades de indexação do repositório e a crescente demanda por informação por parte dos usuários internos e externos a Fiocruz. Neste trabalho propomos a utilização de ferramentas de Ciência de Dados, especialmente técnicas de Mineração de Dados e Aprendizagem de Máquina com o objetivo de aprimorar a Recuperação da Informação, por meio da classificação automática de objetos digitais depositados no Arca e o desenvolvimento e disponibilização de sistema de RI baseado em métricas de qualidade relacionadas aos conceitos de precisão e revocação. 
546 |a EN 
546 |a ES 
546 |a PT 
690 |a Ciência de Dados 
690 |a Armazenamento e Recuperação da Informação 
690 |a Mineração de Dados 
690 |a Aprendizagem de Máquina 
690 |a Repositórios Institucionais. 
690 |a Communication. Mass media 
690 |a P87-96 
690 |a Public aspects of medicine 
690 |a RA1-1270 
655 7 |a article  |2 local 
786 0 |n RECIIS, Vol 11 (2017) 
787 0 |n https://www.reciis.icict.fiocruz.br/index.php/reciis/article/view/1417 
787 0 |n https://doaj.org/toc/1981-6278 
856 4 1 |u https://doaj.org/article/89f0f8fb731646ebb0adf8f9f78af22d  |z Connect to this object online.