fix(style): always display offloads info

11 months ago · 38ff16f3cd
parent ccbc36f991
commit 38ff16f3cd
7 changed files with 72 additions and 29 deletions
--- a/src/locales/en-US/models.ts
+++ b/src/locales/en-US/models.ts
@ -115,5 +115,5 @@ export default {
  'models.form.backend.warning':
    'The backend for GGUF format models uses llama-box.',
  'models.form.backend.warning.llamabox':
-    'Use the llama-box backend, set the model path to a model file, like <span style="font-weight: 700">/usr/local/models/model.gguf</span>. For Ollama models, use <span style="font-weight: 700">/usr/local/models/model</span>.Ensure the model file format is correct.'
+    'Use the llama-box backend, set the absolute model path to the model file, such as <span style="font-weight: 700">/usr/local/models/model.gguf</span>. For sharded models, set the first shard file of the model, such as <span style="font-weight: 700">/usr/local/models/model-00001-of-00004.gguf</span>.'
 };
--- a/src/locales/ru-RU/models.ts
+++ b/src/locales/ru-RU/models.ts
@ -13,8 +13,10 @@ export default {
  'models.form.env': 'Переменные окружения',
  'models.form.configurations': 'Конфигурации',
  'models.form.s3address': 'S3-адрес',
-  'models.form.partialoffload.tips': 'При включении CPU оффлоудинга GPUStack загружает максимум слоев на GPU для производительности. При нехватке ресурсов GPU часть слоев переносится на CPU. Полная CPU-инференция используется только при отсутствии GPU.',
-  'models.form.distribution.tips': 'Позволяет распределить вычисления между одним или несколькими удаленными воркерами при нехватке ресурсов одного GPU/воркера.',
+  'models.form.partialoffload.tips':
+    'При включении CPU оффлоудинга GPUStack загружает максимум слоев на GPU для производительности. При нехватке ресурсов GPU часть слоев переносится на CPU. Полная CPU-инференция используется только при отсутствии GPU.',
+  'models.form.distribution.tips':
+    'Позволяет распределить вычисления между одним или несколькими удаленными воркерами при нехватке ресурсов одного GPU/воркера.',
  'models.openinplayground': 'Открыть в Песочнице',
  'models.instances': 'инстансы',
  'models.table.replicas.edit': 'Редактировать реплики',
@ -22,7 +24,8 @@ export default {
  'model.form.ollamaholder': 'Выберите или введите название модели',
  'model.deploy.sort': 'Сортировка',
  'model.deploy.search.placeholder': 'Поиск моделей в {source}',
-  'model.form.ollamatips': 'Подсказка: ниже представлены предустановленные модели Ollama в GPUStack. Выберите нужную или введите модель для развертывания в поле 【{name}】 справа.',
+  'model.form.ollamatips':
+    'Подсказка: ниже представлены предустановленные модели Ollama в GPUStack. Выберите нужную или введите модель для развертывания в поле 【{name}】 справа.',
  'models.sort.name': 'По имени',
  'models.sort.size': 'По размеру',
  'models.sort.likes': 'По лайкам',
@ -39,13 +42,16 @@ export default {
  'models.search.nofiles': 'Нет доступных файлов',
  'models.search.networkerror': 'Ошибка сетевого подключения!',
  'models.search.hfvisit': 'Убедитесь, что доступен',
-  'models.search.unsupport': 'Модель не поддерживается и может быть нефункциональна после развертывания.',
+  'models.search.unsupport':
+    'Модель не поддерживается и может быть нефункциональна после развертывания.',
  'models.form.scheduletype': 'Тип планирования',
  'models.form.categories': 'Категория модели',
  'models.form.scheduletype.auto': 'Авто',
  'models.form.scheduletype.manual': 'Вручную',
-  'models.form.scheduletype.auto.tips': 'Автоматическое развертывание инстансов модели на подходящие GPU/воркеры в зависимости от текущих ресурсов.',
-  'models.form.scheduletype.manual.tips': 'Позволяет вручную указать GPU/воркеры для развертывания инстансов модели.',
+  'models.form.scheduletype.auto.tips':
+    'Автоматическое развертывание инстансов модели на подходящие GPU/воркеры в зависимости от текущих ресурсов.',
+  'models.form.scheduletype.manual.tips':
+    'Позволяет вручную указать GPU/воркеры для развертывания инстансов модели.',
  'models.form.manual.schedule': 'Ручное распределение',
  'models.table.gpuindex': 'Индекс GPU',
  'models.table.backend': 'Бэкенды',
@ -54,13 +60,19 @@ export default {
  'models.table.layers': 'Слои',
  'models.form.backend': 'Бэкенд',
  'models.form.backend_parameters': 'Параметры бэкенда',
-  'models.search.gguf.tips': 'GGUF-модели используют llama-box (поддерживает Linux, macOS и Windows).',
-  'models.search.vllm.tips': 'Не-GGUF модели используют vox-box для аудио и vLLM (только x86 Linux) для остальных.',
-  'models.search.voxbox.tips': 'Для развертывания аудиомодели снимите отметку GGUF.',
+  'models.search.gguf.tips':
+    'GGUF-модели используют llama-box (поддерживает Linux, macOS и Windows).',
+  'models.search.vllm.tips':
+    'Не-GGUF модели используют vox-box для аудио и vLLM (только x86 Linux) для остальных.',
+  'models.search.voxbox.tips':
+    'Для развертывания аудиомодели снимите отметку GGUF.',
  'models.form.ollamalink': 'Больше моделей в библиотеке Ollama',
-  'models.form.backend_parameters.llamabox.placeholder': 'например: --ctx-size=8192',
-  'models.form.backend_parameters.vllm.placeholder': 'например: --max-model-len=8192',
-  'models.form.backend_parameters.vllm.tips': 'Подробнее о параметрах {backend}',
+  'models.form.backend_parameters.llamabox.placeholder':
+    'например: --ctx-size=8192',
+  'models.form.backend_parameters.vllm.placeholder':
+    'например: --max-model-len=8192',
+  'models.form.backend_parameters.vllm.tips':
+    'Подробнее о параметрах {backend}',
  'models.logs.pagination.prev': 'Предыдущие {lines} строк',
  'models.logs.pagination.next': 'Следующие {lines} строк',
  'models.logs.pagination.last': 'Последняя страница',
@ -68,12 +80,15 @@ export default {
  'models.form.localPath': 'Локальный путь',
  'models.form.filePath': 'Путь к модели',
  'models.form.backendVersion': 'Версия бэкенда',
-  'models.form.backendVersion.tips': 'Фиксация версии обеспечивает стабильность бэкенда при обновлениях GPUStack.',
+  'models.form.backendVersion.tips':
+    'Фиксация версии обеспечивает стабильность бэкенда при обновлениях GPUStack.',
  'models.form.gpuselector': 'Селектор GPU',
-  'models.form.backend.llamabox': 'Для моделей формата GGUF. Поддержка Linux, macOS и Windows.',
+  'models.form.backend.llamabox':
+    'Для моделей формата GGUF. Поддержка Linux, macOS и Windows.',
  'models.form.backend.vllm': 'Для моделей не-GGUF формата. Только x86 Linux.',
  'models.form.backend.voxbox': 'Для аудиомоделей не-GGUF формата.',
-  'models.form.search.gguftips': 'Для воркеров на macOS/Windows отметьте GGUF (для аудиомоделей снимите).',
+  'models.form.search.gguftips':
+    'Для воркеров на macOS/Windows отметьте GGUF (для аудиомоделей снимите).',
  'models.form.button.addlabel': 'Добавить метку',
  'models.filter.category': 'Фильтр по категориям',
  'models.list.more.logs': 'Показать больше',
@ -81,14 +96,24 @@ export default {
  'models.localpath.gguf.tips.title': 'Модель формата GGUF',
  'models.localpat.safe.tips.title': 'Модель формата Safetensors',
  'models.localpath.shared.tips.title': 'Шардированная GGUF-модель',
-  'models.localpath.gguf.tips': 'Укажите файл модели, например: /usr/local/models/model.gguf.',
-  'models.localpath.safe.tips': 'Укажите директорию модели с файлами .safetensors и config.json.',
+  'models.localpath.gguf.tips':
+    'Укажите файл модели, например: /usr/local/models/model.gguf.',
+  'models.localpath.safe.tips':
+    'Укажите директорию модели с файлами .safetensors и config.json.',
  'models.localpath.chunks.tips': `Укажите первый шард модели, например: /usr/local/models/model-00001-of-00004.gguf.`,
-  'models.form.replicas.tips': 'Несколько реплик обеспечивают балансировку нагрузки для { api } запросов.',
+  'models.form.replicas.tips':
+    'Несколько реплик обеспечивают балансировку нагрузки для { api } запросов.',
  'models.table.list.empty': 'Модели отсутствуют!',
-  'models.table.list.getStart': '<span style="margin-right: 5px;font-size: 13px;">Начните работу с</span> <span style="font-size: 14px;font-weight: 700">DeepSeek-R1-Distill-Qwen-1.5B</span>',
+  'models.table.list.getStart':
+    '<span style="margin-right: 5px;font-size: 13px;">Начните работу с</span> <span style="font-size: 14px;font-weight: 700">DeepSeek-R1-Distill-Qwen-1.5B</span>',
  'models.table.llamaAcrossworker': 'Llama-box между воркерами',
  'models.table.vllmAcrossworker': 'vLLM между воркерами',
  'models.form.releases': 'Релизы',
-  'models.form.moreparameters': 'Описание параметров'
+  'models.form.moreparameters': 'Описание параметров',
+  'models.table.vram.allocated':
+    'TODO: Translate key "models.table.vram.allocated"',
+  'models.form.backend.warning':
+    'TODO: Translate key "models.form.backend.warning"',
+  'models.form.backend.warning.llamabox':
+    "TODO: Translate key 'models.form.backend.warning.llamabox'"
 };
--- a/src/locales/zh-CN/models.ts
+++ b/src/locales/zh-CN/models.ts
@ -110,5 +110,5 @@ export default {
  'models.table.vram.allocated': '分配显存',
  'models.form.backend.warning': 'GGUF 格式模型后端用 llama-box。',
  'models.form.backend.warning.llamabox':
-    '使用 llama-box 后端，模型路径需指向 GGUF 文件，如 <span style="font-weight: 700">/usr/local/models/model.gguf</span>，如果是从 Ollama 下载的模型请用 <span style="font-weight: 700">/usr/local/models/model</span> 请确保格式正确。'
+    '使用 llama-box 后端时，设置模型文件的绝对路径，如 <span style="font-weight: 700">/usr/local/models/model.gguf</span>。对于分片模型，设置模型的第一个分片文件，如 <span style="font-weight: 700">/usr/local/models/model-00001-of-00004.gguf</span>。'
 };
--- a/src/pages/llmodels/components/data-form.tsx
+++ b/src/pages/llmodels/components/data-form.tsx
@ -217,8 +217,9 @@ const DataForm: React.FC<DataFormProps> = forwardRef((props, ref) => {
      return;
    }
    const isEndwithGGUF = _.endsWith(value, '.gguf');
+    const isBlobFile = value.split('/').pop().includes('sha256');
    let backend = backendOptionsMap.llamaBox;
-    if (!isEndwithGGUF) {
+    if (!isEndwithGGUF && !isBlobFile) {
      backend = backendOptionsMap.vllm;
    }
    props.onBackendChange?.(backend);
--- a/src/pages/llmodels/components/deploy-modal.tsx
+++ b/src/pages/llmodels/components/deploy-modal.tsx
@ -81,8 +81,15 @@ const AddModal: React.FC<AddModalProps> = (props) => {

  const updateShowWarning = (backend: string) => {
    const localPath = form.current?.getFieldValue?.('local_path');
+    const isBlobFile = localPath?.split('/').pop()?.includes('sha256');

-    console.log('upateShowWarning', backend, localPath);
+    if (isBlobFile) {
+      setWarningStatus({
+        show: false,
+        message: ''
+      });
+      return;
+    }

    if (source !== modelSourceMap.local_path_value || !localPath) {
      return;
@ -233,7 +240,7 @@ const AddModal: React.FC<AddModalProps> = (props) => {
        )}
        <div style={{ display: 'flex', flex: 1, maxWidth: '100%' }}>
          <ColumnWrapper
-            paddingBottom={warningStatus.show ? 140 : 50}
+            paddingBottom={warningStatus.show ? 155 : 50}
            footer={
              <>
                {warningStatus.show && (
--- a/src/pages/llmodels/components/instance-item.tsx
+++ b/src/pages/llmodels/components/instance-item.tsx
@ -364,7 +364,6 @@ const InstanceItem: React.FC<InstanceItemProps> = ({
    }
    return (
      <Tooltip
-        open
        title={
          <span className="flex flex-center">
            <span>
--- a/src/pages/llmodels/components/update-modal.tsx
+++ b/src/pages/llmodels/components/update-modal.tsx
@ -98,6 +98,16 @@ const UpdateModal: React.FC<AddModalProps> = (props) => {
  const updateShowWarning = (backend: string) => {
    const localPath = form.getFieldValue?.('local_path');

+    const isBlobFile = localPath?.split('/').pop()?.includes('sha256');
+
+    if (isBlobFile) {
+      setWarningStatus({
+        show: false,
+        message: ''
+      });
+      return;
+    }
+
    if (formData?.source !== modelSourceMap.local_path_value || !localPath) {
      return;
    }
@ -132,7 +142,7 @@ const UpdateModal: React.FC<AddModalProps> = (props) => {
    }
    form.setFieldValue('backend_version', '');
    handleSetGPUIds(val);
-    updateShowWarning(backend);
+    updateShowWarning(val);
  };

  const handleOnFocus = () => {
@ -145,8 +155,9 @@ const UpdateModal: React.FC<AddModalProps> = (props) => {
      return;
    }
    const isEndwithGGUF = _.endsWith(value, '.gguf');
+    const isBlobFile = value.split('/').pop().includes('sha256');
    let backend = backendOptionsMap.llamaBox;
-    if (!isEndwithGGUF) {
+    if (!isEndwithGGUF || !isBlobFile) {
      backend = backendOptionsMap.vllm;
    }
    handleBackendChange?.(backend);
@ -419,7 +430,7 @@ const UpdateModal: React.FC<AddModalProps> = (props) => {
    >
      <ColumnWrapper
        maxHeight={550}
-        paddingBottom={warningStatus.show ? 85 : 0}
+        paddingBottom={warningStatus.show ? 100 : 0}
        footer={
          <>
            {warningStatus.show && (