From 553fd6cafafd841d9e935ccdf4059b4a3b90a98e Mon Sep 17 00:00:00 2001 From: Nikolaj Olsson Date: Fri, 17 Apr 2020 16:36:58 +0200 Subject: [PATCH] Improve auto guess Hungarian ANSI enc - thx Mounter81 :) Work on #4124 --- libse/LanguageAutoDetect.cs | 10 +++++++++- 1 file changed, 9 insertions(+), 1 deletion(-) diff --git a/libse/LanguageAutoDetect.cs b/libse/LanguageAutoDetect.cs index c7eae57e4..4b5260768 100644 --- a/libse/LanguageAutoDetect.cs +++ b/libse/LanguageAutoDetect.cs @@ -194,7 +194,10 @@ namespace Nikse.SubtitleEdit.Core private static readonly string[] AutoDetectWordsHungarian = { - "hogy", "lesz", "tudom", "vagy", "mondtam", "még" + "hogy", "lesz", "tudom", "vagy", "mondtam", "még", "vagyok", "csak", "Hát", "felesége", "Csak", "utána", "jött", + "Miért", "Akkor", "magát", "holnap", "Tudja", "Köszönöm", "élet", "Örvendek", "vissza", "hogy", "tudom", "Rendben", + "Istenem", "Gyerünk", "értem", "vagyok", "hiszem", "történt", "rendben", "olyan", "őket", "vannak", "mindig", "Kérlek", + "Gyere", "kicsim", "vagyunk" }; private static readonly string[] AutoDetectWordsTurkish = @@ -1107,6 +1110,11 @@ namespace Nikse.SubtitleEdit.Core return encoding1250; } + if (GetCount(textEnc1250, AutoDetectWordsHungarian) > wordMinCount) + { + return encoding1250; + } + var encoding1252 = Encoding.GetEncoding(1252); // Latin - English and some other Western languages var textEnc1252 = encoding1252.GetString(buffer); var pol1252Count = GetCount(textEnc1252, AutoDetectWordsPolish);