Почему не выделяются факты в источнике "Решения арбитражных судов"?
Это шаблонные документы, составленные не на естественном языке. Применение нашей факт-экстракции к таким публикациям неэффективно и потребует в два раза больше ресурсов, чем у нас используется сейчас на всю лингвистическую обработку. Если у клиентов появится желание детектировать какие-то тонкие факты (типа истец-ответчик) из этих документов, то значительно дешевле разработать эту логику под этот шаблонный формат публикаций, чем применять факт-экстракцию для естественного языка. Мало того, она даже в каком-то виде уже разработана. И еще такая же логика уже есть у СПАРК.