Está aqui

Está aqui

  • Através do uso de algoritmos avançados para descobrir padrões em larga escala em textos antigos, os investigadores estão obter conseguir compreender conhecimento através da forma como foram eram moldadas as ideias e a memória no período entre os anos 700 e 1500.
    AKU-ISMC
Professora Bowen Savant: usar a aprendizagem automática em textos antigos

O projeto do ISMC obteve dois grandes desenvolvimentos durante o período de investigação.

A professora Sarah Bowen Savant, do Instituto para o Estudo das Civilizações Muçulmanas da AKU, está a usar algoritmos avançados para descobrir padrões em larga escala em textos antigos. Ela lidera o projeto KITAB - Conhecimento, Tecnologias da Informação e Literatura Árabe, criado por uma equipa internacional de especialistas em TI, história e língua árabe.

 

2020_03_aku_kitab_cht10250_img_3307_edit.jpg

A professora Sarah Bowen Savant, do Instituto para o Estudo das Civilizações Muçulmanas da AKU, lidera o projeto KITAB - Conhecimento, Tecnologias da Informação e Literatura Árabe.
Copyright: 
AKU-ISMC

O KITAB funciona como uma caixa de ferramentas online que procura saber como foram moldadas as ideias e a memória no período entre os anos 700 e 1500. A aplicação de tecnologia avançada e a natureza de acesso aberto do projeto estão em linha com os esforços de promoção da partilha de conhecimento e das parcerias com o intuito de alcançar os ODS.

A equipa concluiu a primeira publicação de todo o seu corpo de trabalho através da Zenodo, uma plataforma online que apoio o acesso aberto à investigação.

O corpo de trabalho inclui 1859 autores e 4288 títulos, num total de 755 689 541 palavras. Se contarmos as várias versões do mesmo título, existem 7144 títulos, num total de 1 520 667 360 palavras. Os textos fazem parte da OpenIT, a Open Islamicate Texts Initiative, uma iniciativa multi-institucional para a construção do primeiro corpo de trabalho académico de acesso automático de textos islâmicos pré-modernos em vários idiomas, incluindo árabe, persa, turco otomano e urdu. A iniciativa tem como objetivo incentivar a análise computacional destas tradições escritas, com o KITAB a ser um dos principais contribuintes dos textos em árabe.

Até ao momento, a maioria dos textos em árabe foi recolhida junto de coleções online de acesso aberto de textos pré-modernos e modernos em árabe. Os textos estão a ser anotados pela equipa e pelos seus parceiros.

Todas as principais versões do corpo de trabalho, assim como os conjuntos de dados analíticos gerados a partir do corpo de trabalho através de métodos diferentes, continuarão a ser publicados na Zenodo, como parte do compromisso do projeto para com o acesso aberto.

 

SIRA DE IBN ISHAQ

No âmbito desta iniciativa, a equipa está a trabalhar com a Biblioteca Nacional do Qatar para criar um corpo de trabalho online e um canal direto para a investigação digital da Sira de Ibn Ishaq (m. 767). A Sira é um caso importante e exemplar de um texto disperso no seio da antiga tradição árabe. Hoje em dia, não resta um único texto original e completo. Em vez disso, existem várias versões, de forma fragmentária, espalhadas em centenas de outros livros, do século IX ao início da era moderna. Estes incluem testemunhos bem conhecidos do texto, incluindo o comentário de Ibn Hisham (m. 828), que contém duas das quatro partes originais, sendo muitas vezes referido erroneamente como a Sira completa de Ibn Ishaq.

Os membros da equipa também procuram melhorar o alinhamento entre os textos que contêm secções da Sira e disponibilizá-los para poderem ser estudados online. As possíveis questões relacionadas com a investigação prendem-se com o modo de produção, transmissão e circulação dos textos desde o período de vida de Ibn Ishaq até ao presente.

O canal direto para a investigação digital tem por base inovações ao nível do reconhecimento ótico de caracteres, a deteção da reutilização de texto, a modelagem de dados e a visualização de dados para ajudar a descobrir este importante texto.