wger-project
diff --git a/‎pyproject.toml‎
Lines changed: 1 addition & 1 deletion b/‎pyproject.toml‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎uv.lock‎
Lines changed: 53 additions & 0 deletions b/‎uv.lock‎
Lines changed: 53 additions & 0 deletions
diff --git a/‎wger/core/api/serializers.py‎
Lines changed: 64 additions & 2 deletions b/‎wger/core/api/serializers.py‎
Lines changed: 64 additions & 2 deletions
diff --git a/‎wger/core/api/views.py‎
Lines changed: 16 additions & 3 deletions b/‎wger/core/api/views.py‎
Lines changed: 16 additions & 3 deletions
@@ -56,6 +56,7 @@ dependencies = [
     "fontawesomefree~=6.6.0",
     "icalendar==6.3.1",
     "invoke==2.2.0",
+    "lingua-language-detector==2.1.1",
     "openfoodfacts==2.6.1",
     "packaging==25.0",
     "pillow==11.3.0",
@@ -128,7 +129,6 @@ exclude = [
     ".ruff_cache",
     ".svn",
     ".tox",
-    ".venv",
     ".vscode",
     "__pypackages__",
     "_build",
 
@@ -21,8 +21,8 @@
 from django.contrib.auth.models import User
 from django.contrib.auth.password_validation import validate_password
 from django.http import HttpRequest
-
 # Third Party
+from lingua import LanguageDetectorBuilder
 from rest_framework import serializers
 from rest_framework.fields import empty
 from rest_framework.validators import UniqueValidator
@@ -36,7 +36,6 @@
     WeightUnit,
 )
 
-
 logger = logging.getLogger(__name__)
 
 
@@ -197,3 +196,66 @@ class RoutineWeightUnitSerializer(serializers.ModelSerializer):
     class Meta:
         model = WeightUnit
         fields = ['id', 'name']
+
+
+class LanguageCheckSerializer(serializers.Serializer):
+    """
+    Serializer for language check
+    """
+
+    language = serializers.PrimaryKeyRelatedField(queryset=Language.objects.all(), required=False)
+    language_code = serializers.CharField(required=False, min_length=2, max_length=2)
+    input = serializers.CharField(min_length=10)
+
+    def validate(self, data):
+        """
+        Check that the detected language of the description corresponds with the
+        provided language.
+        """
+        language = data.get('language')
+        language_code = data.get('language_code')
+
+        if not language and not language_code:
+            raise serializers.ValidationError(
+                {'language': 'Either a language ID or a language code must be provided.'}
+            )
+
+        if not language:
+            try:
+                language = Language.objects.get(short_name=language_code)
+            except Language.DoesNotExist:
+                raise serializers.ValidationError(
+                    {'language': f'Language with code "{language_code}" does not exist.'}
+                )
+
+        # Try to detect the language
+        detector = (
+            LanguageDetectorBuilder.from_all_languages().with_preloaded_language_models().build()
+        )
+        input_str = data.get('input')
+
+        detected_language = detector.detect_language_of(input_str)
+        detected_language_code = detected_language.iso_code_639_1.name.lower()
+        confidence_values = detector.compute_language_confidence_values(input_str)
+        logger.debug(
+            f'Detected language: {detected_language_code}, '
+            f'confidence values: {confidence_values}, '
+            f'input: {input_str}'
+        )
+
+        if detected_language_code != language.short_name.lower():
+            raise serializers.ValidationError(
+                {
+                    'check': {
+                        'result': False,
+                        'detected_language': detected_language_code,
+                        'message': f'The detected language is "{detected_language.name.capitalize()}" ({detected_language_code}), '
+                                   f'which does not match your selected language "{language.full_name.capitalize()}" '
+                                   f'({language.short_name}). If you believe this is incorrect, try adding more content '
+                                   f'or rephrasing your text, as language detection works better with longer or more '
+                                   f'complete sentences.',
+                    }
+                }
+            )
+
+        return super().validate(data)
@@ -23,7 +23,6 @@
 from django.contrib.auth.models import User
 from django.utils.decorators import method_decorator
 from django.views.decorators.cache import cache_page
-
 # Third Party
 from django_email_verification import send_email
 from drf_spectacular.types import OpenApiTypes
@@ -37,7 +36,10 @@
     status,
     viewsets,
 )
-from rest_framework.decorators import action
+from rest_framework.decorators import (
+    action,
+    api_view,
+)
 from rest_framework.fields import (
     BooleanField,
     CharField,
@@ -50,6 +52,7 @@
 
 # wger
 from wger.core.api.serializers import (
+    LanguageCheckSerializer,
     LanguageSerializer,
     LicenseSerializer,
     RepetitionUnitSerializer,
@@ -74,7 +77,6 @@
     get_version,
 )
 
-
 logger = logging.getLogger(__name__)
 
 
@@ -406,3 +408,14 @@ class RoutineWeightUnitViewSet(viewsets.ReadOnlyModelViewSet):
     serializer_class = RoutineWeightUnitSerializer
     ordering_fields = '__all__'
     filterset_fields = ('name',)
+
+
+@api_view(['POST'])
+def check_language(request):
+    """
+    Checks the language of a string
+    """
+    serializer = LanguageCheckSerializer(data=request.data)
+    serializer.is_valid(raise_exception=True)
+
+    return Response({'result': True})