mirror of
https://github.com/SubtitleEdit/subtitleedit.git
synced 2024-11-22 03:02:35 +01:00
Improve Ukranian language auto-detect - thx Preben :)
This commit is contained in:
parent
f2239c7706
commit
6097d9374b
@ -3,7 +3,7 @@
|
|||||||
3.6.12 (xth March 2023) BETA
|
3.6.12 (xth March 2023) BETA
|
||||||
* NEW:
|
* NEW:
|
||||||
* Add/remove embedded subtitles to/from video files - thx David
|
* Add/remove embedded subtitles to/from video files - thx David
|
||||||
* Add Whisper via GPU (ConstMe, Windows-only) - thx albino1/darnn/smith02ct
|
* Add Whisper via GPU (Const-me, Windows-only) - thx albino1/darnn/smith02ct
|
||||||
* Allow video cut when exporting video with burned-in sub - thx Daniela/David/Leon
|
* Allow video cut when exporting video with burned-in sub - thx Daniela/David/Leon
|
||||||
* Batch convert: Image-based format to PNG with time code - thx Ninelpienel
|
* Batch convert: Image-based format to PNG with time code - thx Ninelpienel
|
||||||
* Add new shortcut for split + auto-br - thx oep42
|
* Add new shortcut for split + auto-br - thx oep42
|
||||||
|
@ -158,16 +158,18 @@ namespace Nikse.SubtitleEdit.Core.Common
|
|||||||
|
|
||||||
private static readonly string[] AutoDetectWordsBulgarian =
|
private static readonly string[] AutoDetectWordsBulgarian =
|
||||||
{
|
{
|
||||||
"беше", "[Бб]лагодаря", "бързо", "вас", "[Вв]аше", "[Вв]ече", "[Вв]иждам", "време", "[Вв]сичк[ио]", "години", "Да", "[Дд]обре", "дяволите",
|
"беше", "[Бб]лагодаря", "бързо", "вас", "[Вв]аше", "[Вв]ече", "[Вв]иждам", "време", "[Вв]сичк[ио]", "години",
|
||||||
"за", "Защо", "защото", "[Зз]начи", "иска[мнш]", "[Кк]ак", "[Кк]акво", "като", "ко[еий]то", "малко", "много", "[Мм]оже[хш]?", "място",
|
"Да", "[Дд]обре", "дяволите", "за", "Защо", "защото", "[Зз]начи", "иска[мнш]", "[Кк]ак", "[Кк]акво", "като",
|
||||||
"нас", "[Нн]е", "н[еи]що", "н[ия]кой", "[Нн]яма", "преди", "повече", "става", "така", "[Тт]ова", "[Тт]олкова", "[Тт]рябва", "тук",
|
"ко[еий]то", "малко", "много", "[Мм]оже[хш]?", "място", "нас", "[Нн]е", "н[еи]що", "н[ия]кой", "[Нн]яма",
|
||||||
|
"преди", "повече", "става", "така", "[Тт]ова", "[Тт]олкова", "[Тт]рябва", "тук",
|
||||||
"Хайде", "човек"
|
"Хайде", "човек"
|
||||||
};
|
};
|
||||||
|
|
||||||
private static readonly string[] AutoDetectWordsUkrainian =
|
private static readonly string[] AutoDetectWordsUkrainian =
|
||||||
{
|
{
|
||||||
"[Нн]і", "[Пп]ривіт", "[Цц]е", "[Щщ]о", "[Йй]ого", "[Вв]ін", "[Яя]к", "[Гг]аразд", "[Яя]кщо", "[Мм]ені", "[Тт]вій", "[Її]х", "[Вв]ітаю", "[Дд]якую", "вже", "було", "був", "цього",
|
"Вона", "мене", "[Нн]і", "[Пп]ривіт", "[Цц]е", "[Щщ]о", "[Йй]ого", "[Вв]ін", "[Яя]к", "[Гг]аразд", "[Яя]кщо", "[Мм]ені", "[Тт]вій", "[Її]х", "[Вв]ітаю", "[Дд]якую", "вже", "було", "був", "цього",
|
||||||
"нічого", "немає", "може", "знову", "бо", "щось", "щоб", "цим", "тобі", "хотів", "твоїх", "мої", "мій", "має", "їм", "йому", "дуже"
|
"нічого", "немає", "може", "знову", "бо", "щось", "щоб", "цим", "тобі", "хотів", "твоїх", "мої", "мій", "має", "їм", "йому", "дуже",
|
||||||
|
"Привіт", "побачення", "тобою", "побачення", "Гаразд", "повинні",
|
||||||
};
|
};
|
||||||
|
|
||||||
private static readonly string[] AutoDetectWordsAlbanian =
|
private static readonly string[] AutoDetectWordsAlbanian =
|
||||||
@ -521,12 +523,17 @@ namespace Nikse.SubtitleEdit.Core.Common
|
|||||||
if (count > bestCount)
|
if (count > bestCount)
|
||||||
{
|
{
|
||||||
var bulgarianCount = GetCount(text, AutoDetectWordsBulgarian);
|
var bulgarianCount = GetCount(text, AutoDetectWordsBulgarian);
|
||||||
|
var ukrainianCount = GetCount(text, AutoDetectWordsUkrainian);
|
||||||
if (bulgarianCount > count)
|
if (bulgarianCount > count)
|
||||||
{
|
{
|
||||||
|
if (ukrainianCount > bulgarianCount)
|
||||||
|
{
|
||||||
|
return "uk"; // Ukrainian
|
||||||
|
}
|
||||||
|
|
||||||
return "bg"; // Bulgarian
|
return "bg"; // Bulgarian
|
||||||
}
|
}
|
||||||
|
|
||||||
var ukrainianCount = GetCount(text, AutoDetectWordsUkrainian);
|
|
||||||
if (ukrainianCount > count)
|
if (ukrainianCount > count)
|
||||||
{
|
{
|
||||||
return "uk"; // Ukrainian
|
return "uk"; // Ukrainian
|
||||||
|
Loading…
Reference in New Issue
Block a user