Leveraging Multilingual News Websites for Building a Kurdish Parallel Corpus

دەربارەی کوردیپێدیا

بابەت بەهەڵکەوت

ڕێساکانی بەکارهێنان

ئەرشیڤوانانی کوردیپێدیا

بیروڕاکانتان

دڵخوازەکان

کڕۆنۆلۆژیای ڕووداوەکان

چالاکییەکان - کوردیپێدیا

یارمەتی

زۆرتر

ناونامە بۆ منداڵانی کورد

گەڕان بە کرتە

ئامار

بابەت

587,512

وێنە

124,707

پەرتووک PDF

22,131

فایلی پەیوەندیدار

127,202

ڤیدیۆ

2,193

زمان

کوردیی ناوەڕاست - Central Kurdish

317,858

Kurmancî - Upper Kurdish (Latin)

95,969

هەورامی - Kurdish Hawrami

67,788

عربي - Arabic

44,417

کرمانجی - Upper Kurdish (Arami)

26,858

فارسی - Farsi

16,057

English - English

8,545

Türkçe - Turkish

3,843

Deutsch - German

2,042

لوڕی - Kurdish Luri

1,785

Pусский - Russian

1,145

Français - French

359

Nederlands - Dutch

131

Zazakî - Kurdish Zazaki

Svenska - Swedish

Español - Spanish

Italiano - Italian

Polski - Polish

Հայերեն - Armenian

لەکی - Kurdish Laki

Azərbaycanca - Azerbaijani

日本人 - Japanese

Norsk - Norwegian

中国的 - Chinese

עברית - Hebrew

Ελληνική - Greek

Fins - Finnish

Português - Portuguese

Catalana - Catalana

Esperanto - Esperanto

Ozbek - Uzbek

Тоҷикӣ - Tajik

Srpski - Serbian

ქართველი - Georgian

Čeština - Czech

Lietuvių - Lithuanian

Hrvatski - Croatian

балгарская - Bulgarian

Kiswahili سَوَاحِلي -

हिन्दी - Hindi

українська - Ukrainian

қазақ - Kazakh

Cebuano - Cebuano

ترکمانی - Turkman (Arami Script)

پۆل

کوردیی ناوەڕاست

ژیاننامە

32,234

شوێنەکان

17,054

پارت و ڕێکخراوەکان

1,482

بڵاوکراوەکان (گۆڤار، ڕۆژنامە، ماڵپەڕ و دەزگا میدیاییەکان و ...)

1,111

وێنە و پێناس

9,468

کارە هونەرییەکان

1,773

ڕێکەوت و ڕووداو (کڕۆنۆلۆژیا)

16,047

نەخشەکان

284

ناوی کوردی

2,820

پەند

13,749

وشە و دەستەواژە

109,192

شوێنەوار و کۆنینە

788

خواردنی کوردی

134

پەرتووکخانە

27,066

کلتوور - گاڵتەوگەپ

4,717

کورتەباس

22,367

شەهیدان

12,137

کۆمەڵکوژی

11,395

بەڵگەنامەکان

8,746

هۆز - تیرە - بنەماڵە

236

ئامار و ڕاپرسی

4,631

کلتوور - مەتەڵ

3,147

یارییە کوردەوارییەکان

279

زانستە سروشتییەکان

ڤیدیۆ

2,064

بەرهەمە کوردستانییەکان

کەلوپەلی سەربازیی بەکارهاتوو لە کوردستان

ژینگەی کوردستان

102

هۆنراوە

10,639

دۆزی ژن

فەرمانگەکان

1,121

مۆزەخانە

نەریت

161

گیانلەبەرانی کوردستان

734

ڕووه‌كی كورده‌واری (گژوگیا و دار)

910

گەشتوگوزار

ئیدیۆم

937

دەزگەی چاپ و بڵاوکردنەوە

کۆگای فایلەکان

MP3

1,546

PDF

34,792

MP4

4,051

IMG

235,688

∑ تێکڕا

276,077

گەڕان بەدوای ناوەڕۆکدا

Leveraging Multilingual News Websites for Building a Kurdish Parallel Corpus

پۆل: کورتەباس

زمانی بابەت:

English - English

هاوکارانی کوردیپێدیا، لە هەموو بەشەکانی کوردستانەوە، زانیارییە گرنگەکان بۆ هاوزمانانیان ئەرشیڤدەکەن.

Leveraging Multilingual News Websites for Building a Kurdish Parallel Corpus

Leveraging Multilingual News Websites for Building a Kurdish Parallel Corpus.
Sina Ahmadi, Hossein Hassani, Daban Q. Jaff.
2020.
Machine translation has been a major motivation of development in natural language processing. Despite the burgeoning achievements in creating more efficient machine translation systems thanks to deep learning methods, parallel corpora have remained indispensable for progress in the field. In an attempt to create parallel corpora for the Kurdish language, in this paper, we describe our approach in retrieving potentially-alignable news articles from multi-language websites and manually align them across dialects and languages based on lexical similarity and transliteration of scripts. We present a corpus containing 12,327 translation pairs in the two major dialects of Kurdish, Sorani and Kurmanji. We also provide 1,797 and 650 translation pairs in English-Kurmanji and English-Sorani. The corpus is publicly available under the CC BY-NC-SA 4.0 license. [1]
=KTML_Link_External_Begin=https://www.kurdipedia.org/docviewer.aspx?id=445059&document=0001.PDF=KTML_Link_External_Between= Click to read the article: Leveraging Multilingual News Websites for Building a Kurdish Parallel Corpus=KTML_Link_External_End=

کوردیپێدیا بەرپرس نییە لە ناوەڕۆکی ئەم تۆمارە و خاوەنەکەی لێی بەرپرسیارە. کوردیپێدیا بە مەبەستی ئەرشیڤکردن تۆماری کردووە.

ئەم بابەتە بەزمانی (English) نووسراوە، کلیک لە ئایکۆنی

بکە بۆ کردنەوەی بابەتەکە بەو زمانەی کە پێی نووسراوە!

This item has been written in (English) language, click on icon

to open the item in the original language!

ئەم بابەتە 2,619 جار بینراوە

ڕای خۆت دەربارەی ئەم بابەتە بنووسە!

هاشتاگ

سەرچاوەکان

[1] ماڵپەڕ | English | academia.edu

فایلی پەیوەندیدار: 1

[زۆرتر...]