fix(translate): mejorar regex de segmentación y detección de caracteres internacionales
This commit is contained in:
@@ -57,7 +57,8 @@ from botdiscord.database import get_available_languages, get_bot_languages
|
|||||||
|
|
||||||
async def _do_translate_request(session, url, text, target_code):
|
async def _do_translate_request(session, url, text, target_code):
|
||||||
"""Función interna para realizar una única petición de traducción."""
|
"""Función interna para realizar una única petición de traducción."""
|
||||||
if not text.strip() or not re.search(r'[a-zA-ZáéíóúÁÉÍÓÚñÑ]', text):
|
# Verificamos si el segmento tiene al menos una letra de cualquier idioma
|
||||||
|
if not text.strip() or not re.search(r'[a-zA-Z\u00C0-\u017F]', text):
|
||||||
return text
|
return text
|
||||||
|
|
||||||
payload = {
|
payload = {
|
||||||
@@ -71,11 +72,15 @@ async def _do_translate_request(session, url, text, target_code):
|
|||||||
async with session.post(url, json=payload, timeout=10) as resp:
|
async with session.post(url, json=payload, timeout=10) as resp:
|
||||||
if resp.status == 200:
|
if resp.status == 200:
|
||||||
data = await resp.json()
|
data = await resp.json()
|
||||||
return data.get("translatedText", text)
|
translated = data.get("translatedText", text)
|
||||||
|
# Si el resultado es igual al original, puede ser que el motor fallara,
|
||||||
|
# devolvemos el texto original tal cual.
|
||||||
|
return translated
|
||||||
else:
|
else:
|
||||||
return text # Devolvemos el original si falla la API
|
# En caso de error de API (404, 500, etc) devolvemos el original
|
||||||
|
return text
|
||||||
except Exception:
|
except Exception:
|
||||||
return text # Devolvemos el original si hay error de conexión
|
return text
|
||||||
|
|
||||||
async def translate_text(text: str, target_lang: str) -> str:
|
async def translate_text(text: str, target_lang: str) -> str:
|
||||||
url = get_libretranslate_url()
|
url = get_libretranslate_url()
|
||||||
@@ -84,9 +89,14 @@ async def translate_text(text: str, target_lang: str) -> str:
|
|||||||
|
|
||||||
target_code = NAME_TO_CODE.get(target_lang, target_lang)
|
target_code = NAME_TO_CODE.get(target_lang, target_lang)
|
||||||
|
|
||||||
# Segmentación: Dividimos por oraciones (. ! ? \n) pero manteniendo los delimitadores
|
# Segmentación mejorada:
|
||||||
# El patrón busca los delimitadores y los incluye en la lista resultante
|
# Divide por signos de puntuación (. ! ?) o saltos de línea,
|
||||||
segments = re.split(r'(\. |\! |\? |\n)', text)
|
# permitiendo que después haya espacios, comas u otros signos.
|
||||||
|
# Usamos un grupo de captura para no perder los delimitadores.
|
||||||
|
segments = re.split(r'([.!?]+\s*|\n+)', text)
|
||||||
|
|
||||||
|
# Filtramos segmentos vacíos que puedan quedar tras el split
|
||||||
|
segments = [s for s in segments if s]
|
||||||
|
|
||||||
async with aiohttp.ClientSession() as session:
|
async with aiohttp.ClientSession() as session:
|
||||||
tasks = []
|
tasks = []
|
||||||
|
|||||||
Reference in New Issue
Block a user