Language Pairs

Amharic to Arabic: AI Translation Comparison

Updated 2026-03-12

Amharic to Arabic: AI Translation Comparison

Amharic is the official language of Ethiopia, spoken by approximately 57 million people as a first or second language. Arabic, with over 400 million speakers across more than 20 countries, is a lingua franca throughout the Middle East and North Africa. Both languages use non-Latin scripts: Amharic employs the Ge’ez (Ethiopic) script, while Arabic uses the Arabic abjad. These two Afro-Asiatic languages share distant Semitic roots, with Amharic belonging to the South Semitic branch and Arabic to the Central Semitic branch. Translation demand between Amharic and Arabic is driven by migration, trade between the Horn of Africa and the Gulf states, religious scholarship, and diplomatic communication within the African Union and Arab League.

This comparison evaluates five leading AI translation systems on Amharic-to-Arabic accuracy, naturalness, and suitability for different use cases.

Translation comparisons are based on automated metrics and editorial evaluation. Quality varies by language pair and content type.

Accuracy Comparison Table

SystemBLEU ScoreCOMET ScoreEditorial Rating (1-10)Best For
Google Translate21.40.7315.3General-purpose, free access
DeepL18.20.7044.8Not natively supported; routed via English
GPT-424.70.7626.1Contextual understanding, religious texts
Claude23.10.7485.7Long-form content, formal documents
NLLB-20025.90.7786.4Direct low-resource translation, self-hosted

Translation Quality Metrics: BLEU, COMET, and Human Evaluation Explained

Example Translations

Formal Diplomatic Correspondence

Source (Amharic): “የኢትዮጵያ መንግሥት ከአረብ ሊግ ጋር ያለውን የንግድ ግንኙነት ለማጠናከር ቁርጠኝነቱን ይገልጻል። በሁለቱ ወገኖች መካከል ያለው ትብብር ለሁለቱም ሕዝቦች ጥቅም ይሰጣል።“

SystemTranslation
Googleتعرب الحكومة الإثيوبية عن التزامها بتعزيز العلاقات التجارية مع جامعة الدول العربية. التعاون بين الطرفين يعود بالنفع على كلا الشعبين.
DeepLتعبر الحكومة الإثيوبية عن التزامها بتقوية العلاقات التجارية مع الجامعة العربية. التعاون بين الجانبين يفيد كلا الشعبين.
GPT-4تُعرب حكومة إثيوبيا عن التزامها بتعزيز العلاقات التجارية مع جامعة الدول العربية. إن التعاون القائم بين الطرفين يعود بالمنفعة على شعبي البلدين.
Claudeتعرب الحكومة الإثيوبية عن التزامها بتعزيز العلاقات التجارية مع جامعة الدول العربية. ويعود التعاون بين الجانبين بالنفع على كلا الشعبين.
NLLB-200تعبر الحكومة الإثيوبية عن التزامها بتعزيز العلاقات التجارية مع جامعة الدول العربية. التعاون بين الطرفين يفيد كلا الشعبين.

Assessment: GPT-4 produces the most natural diplomatic Arabic with “شعبي البلدين” (the peoples of both countries) using the dual form correctly. NLLB-200 performs well on this pair due to strong Amharic-Arabic parallel data in its training set. DeepL routes through English as a pivot language, losing some nuance from the Amharic source.

Casual Conversation

Source (Amharic): “ዛሬ አዲስ አበባ ላይ ምን ያህል ሙቀት ነው! ቡና ቤት ሄደን እንቀመጥ። ጥሩ ቡና ሲጠጡ ሁሉ ነገር ይሻላል።“

SystemTranslation
Googleكم هو حار في أديس أبابا اليوم! لنذهب ونجلس في مقهى. عندما تشرب قهوة جيدة كل شيء يتحسن.
DeepLما أشد الحرارة في أديس أبابا اليوم! دعنا نذهب إلى المقهى. كل شيء يتحسن عند شرب القهوة الجيدة.
GPT-4يا لشدة الحر في أديس أبابا اليوم! هيا نذهب ونجلس في المقهى. كل شيء يصبح أفضل مع فنجان قهوة طيبة.
Claudeما أشد الحرارة في أديس أبابا اليوم! لنذهب ونجلس في مقهى. كل شيء يتحسن عندما تشرب قهوة جيدة.
NLLB-200كم هو حار في أديس أبابا اليوم! لنذهب ونجلس في المقهى. كل شيء يتحسن عندما تشرب قهوة جيدة.

Assessment: GPT-4 captures the casual tone best with “هيا نذهب” (come on, let’s go) and “فنجان قهوة طيبة” (a cup of good coffee), which reflects conversational Arabic. Ethiopia’s coffee culture (the birthplace of coffee) is a key cultural element that benefits from nuanced translation. NLLB-200 handles the casual register competently for a low-resource pair.

Religious Text

Source (Amharic): “በዓለም ላይ ሰላም እንዲሰፍን ሁላችንም መጸለይ አለብን። የእምነት መንገድ ትዕግስትና ርህራሄ ይጠይቃል። በአንድነት ተስፋ እናደርጋለን።“

SystemTranslation
Googleيجب أن نصلي جميعاً من أجل أن يسود السلام في العالم. طريق الإيمان يتطلب الصبر والرحمة. معاً نأمل.
DeepLعلينا جميعاً أن نصلي من أجل أن يعم السلام في العالم. درب الإيمان يستلزم الصبر والرأفة. نأمل معاً.
GPT-4ينبغي لنا جميعاً أن نصلي لكي يعمّ السلام في ربوع العالم. إن سبيل الإيمان يستوجب الصبر والرحمة. ومعاً نحدونا الأمل.
Claudeيجب أن نصلي جميعاً ليسود السلام في العالم. يتطلب طريق الإيمان الصبر والرحمة. معاً نضع أملنا.
NLLB-200يجب أن نصلي جميعاً لكي يسود السلام في العالم. طريق الإيمان يتطلب الصبر والرحمة. في وحدتنا نأمل.

Assessment: GPT-4 uses elevated religious Arabic register with “ربوع العالم” (throughout the world) and “نحدونا الأمل” (hope drives us), matching Amharic religious discourse conventions. NLLB-200’s “في وحدتنا نأمل” (in our unity we hope) captures the Amharic “በአንድነት” (in togetherness) accurately. Both Amharic and Arabic have rich religious vocabulary given their historical ties to Christianity and Islam respectively.

Strengths and Weaknesses

Google Translate

Strengths: Free and accessible. Reasonable baseline quality for general content. Weaknesses: Struggles with Amharic morphological complexity. Loses cultural nuance in pivot translation.

DeepL

Strengths: Strong Arabic output quality when source meaning is preserved. Weaknesses: No direct Amharic support; relies on English pivot, introducing compounded errors. Not recommended for this pair.

GPT-4

Strengths: Best contextual understanding. Handles religious and diplomatic registers well. Understands cultural context of both languages. Weaknesses: Higher cost per query. Occasional over-elaboration in Arabic output.

Claude

Strengths: Consistent quality for long documents. Reliable formal register. Good for institutional and NGO content. Weaknesses: Less natural than GPT-4 for idiomatic expressions. Conservative translations that can feel stilted.

NLLB-200

Strengths: Best direct translation without pivot language. Free and self-hostable. Strong performance on this specific pair due to dedicated Amharic-Arabic training data. Weaknesses: Limited register flexibility. Weaker on colloquial content. No contextual reasoning.

Recommendations

Use CaseRecommended System
Diplomatic / AU communicationsGPT-4
Religious and scholarly textsGPT-4
Migration and legal documentsClaude
High-volume news translationNLLB-200 (self-hosted)
General-purpose, budget optionGoogle Translate
Trade and commerceNLLB-200 or Google Translate
NGO and humanitarian contentClaude

Best Translation AI in 2026: Complete Model Comparison

Key Takeaways

  • NLLB-200 leads on direct Amharic-to-Arabic translation due to dedicated parallel training data, while GPT-4 excels at contextual understanding and register-appropriate output for diplomatic and religious content.
  • Both languages belong to the Afro-Asiatic family, sharing distant Semitic roots, yet their scripts, morphology, and grammatical structures diverge significantly, making direct translation challenging for all systems.
  • DeepL lacks native Amharic support and routes through English, making it the weakest option for this pair despite its general Arabic quality.
  • Growing migration from the Horn of Africa to Gulf states and expanding AU-Arab League cooperation are driving increased demand for reliable Amharic-Arabic translation tools.

Next Steps