2019년에 시작된 이 계획은 다음을 기반으로 합니다. 코퍼스 텍스트, 2025년이면 40주년이 되고, 벌써 1억 단어를 돌파했습니다. “1832년부터 현재 사이의 텍스트가 있습니다. “현재 우리는 2022년의 텍스트를 작업하고 있습니다.”라고 그는 설명합니다. 코퍼스는 IEC 웹사이트를 통해 대중에게 공개됩니다. “사용자는 단어로 검색할 수 있습니다. 예를 들어, 동사 ‘think’ 뒤에 전치사 ‘en’ 또는 ‘amb’가 오는 텍스트 문자열 등이 있습니다. 이는 문법 분석에 특히 유용합니다.”라고 그는 강조합니다.
그래서 2019년에는 “기존 텍스트의 원본 음성 녹음”으로 하는 것이 좋겠다고 결정했습니다. 마요르카 출신이기 때문에 그들은 섬에서 시작하여 발렌시아 왕국, 중앙 카탈로니아 왕국, 그리고 북부 왕국으로 계속되었습니다. “IEC의 우리 스스로가 매우 중요한 기술 혁신인 플랫폼을 만들었습니다.”라고 그는 말합니다.
또 다른 중요한 측면은 이 문장은 인공지능(AI)으로 생성된 것이 아닙니다. 그러나 Quater Poets는 마요르카의 기록 보관소에서 왔으며 나중에 Consel에 의해 책 형태로 출판되었습니다. 존 미랄레스 우리 문화의 위대한 이름 네 명과의 인터뷰. Llorenç Moyà와 Gilabert, Jaume Vidal과 Alcover, Josep Maria Llompart, Blai Bonet.
“인터뷰는 2시간 동안 진행되는데, 사용 가능한 자료, 침묵, 대담자의 질문을 제외하면 1시간 30분 이상이 남습니다. 이는 코퍼스에 대한 많은 자료입니다. 사용 가능한 단어 17,167개. 현재 총 코퍼스가 940,000 단어에 도달하고 점점 늘어나고 있다는 점을 고려해야 합니다. “흥미로운 점은 이 도구를 사용하면 Lompart가 원래 음성으로 말한 단어를 검색하고 특정 인용문이나 단편을 제공할 수 있다는 것입니다.” Lompart는 이 프로젝트를 처음 선보이고 있으며 이후에는 더 많은 프로젝트가 진행될 예정입니다. 그러나 Dolce는 그들이 반드시 그렇게 잘 알려진 문화 인물은 아니라고 지적합니다.
“소리는 언어의 생명이자 가장 기본적인 부분입니다. 이런 의미에서 이 사전은 카탈루냐어의 다양한 방언의 발음을 관찰하고 모음이 어떻게 만들어지는지, 더 개방적이고 폐쇄적인지 또는 우리의 경우 중성 모음을 확인하는 데 사용될 수 있습니다.”라고 그는 설명합니다. 구두로든 서면으로든 원본 텍스트 모음으로 구성되어 있으므로 중요한 것은 수정 방법이 아니라 사람들이 이에 대해 어떻게 이야기하는지입니다. 다른 언어.
이러한 의미에서, 말뭉치(corpus)는 설명적이며 IEC의 임무인 규제 결정을 내릴 때 큰 도움이 된다는 점을 기억해야 합니다. 즉, 이는 규제의 초기 단계입니다.”라고 Dolce는 설명합니다.다음 11월 27일Ramon Lull의 모든 날과 마찬가지로 문학 부문에서는 DIEC의 개혁을 소개할 것입니다.