Spaces:

abujyhy
/

test

Sleeping

App Files Files Community

abujyhy commited on Nov 27, 2025

Commit

1f8ed27

1 Parent(s): e060753

create app

Browse files

Files changed (3) hide show

README.md +9 -23
app.py +56 -86
requirements.txt +3 -1

README.md CHANGED Viewed

@@ -1,30 +1,16 @@
 ---
-title: 日本語LLMチャットデモ
-emoji: 🧪
-colorFrom: blue
-colorTo: purple
 sdk: gradio
-sdk_version: "4.0.0"
 app_file: app.py
 pinned: false
 ---
-# 日本語 LLM Chat (CPU / Free)
-- **無料枠（CPU）で動作**する Gradio チャットデモです。
-- 既定モデル: `TinyLlama/TinyLlama-1.1B-Chat-v1.0`
-- モデル切替: Spaces → Settings → Variables → `MODEL_ID` に任意のモデルIDを指定（例: `Qwen/Qwen2.5-1.5B-Instruct`）
-## 使い方
-1. 画面上部のスライダーで `max_new_tokens / temperature / top_p` を調整
-2. 入力欄に質問を入力 → 送信
-3. 遅い場合は `max_new_tokens` を小さく、モデルは軽量を選択
-## 注意
-- 無料CPUは処理が遅いです。出力トークンを短くしてください。
-- 大きいモデル（7B以上）は CPU では非推奨です。
-## ライセンス
-- 各モデルのライセンスはモデルカードを確認してください。

 ---
+title: OpenJourney Image Generator (CPU/Free)
+emoji: 🎨
+colorFrom: purple
+colorTo: indigo
 sdk: gradio
+sdk_version: "4.16.0"
 app_file: app.py
 pinned: false
 ---
+# OpenJourney (prompthero/openjourney) 画像生成デモ
+- 無料枠（**CPU Basic**）で動作するGradioアプリ
+- モデル: `prompthero/openjourney`（Stable Diffusion 1.5系の派生）
+- 速度重視ならGPU枠に切り替え（有料）

app.py CHANGED Viewed

@@ -1,107 +1,77 @@
 import os
-import gradio as gr
 import torch
-from transformers import AutoTokenizer, AutoModelForCausalLM
-# ---- モデル選択（軽量を既定） ----
-DEFAULT_MODEL_ID = os.environ.get("MODEL_ID", "TinyLlama/TinyLlama-1.1B-Chat-v1.0")
-# 例：よりリッチにしたい時は Spaces の「Settings -> Variables」で MODEL_ID=Qwen/Qwen2.5-1.5B-Instruct を指定
-# ---- 省メモリ・CPU前提のロード設定 ----
-device = torch.device("cpu")  # 無料枠CPU
-dtype = torch.float32         # CPUはfloat32が安定。bfloat16が使える環境なら切替可
-tokenizer = AutoTokenizer.from_pretrained(DEFAULT_MODEL_ID)
-model = AutoModelForCausalLM.from_pretrained(
-    DEFAULT_MODEL_ID,
-    torch_dtype=dtype,
-    low_cpu_mem_usage=True
-).to(device)
-model.eval()
-SYSTEM_PROMPT = (
-    "あなたは日本語が得意で、丁寧かつ簡潔に回答するアシスタントです。"
-    "箇条書きや見出しを適宜使って、読みやすく答えてください。"
 )
-# ---- チャット履歴を整形（モデルに合わせてカスタマイズ可能） ----
-def build_prompt(system, history, user_input: str) -> str:
-    lines = [f"[システム]\n{system}\n"]
-    for (u, a) in history:
-        lines.append(f"[ユーザー]\n{u}\n")
-        lines.append(f"[アシスタント]\n{a}\n")
-    lines.append(f"[ユーザー]\n{user_input}\n")
-    lines.append("[アシスタント]\n")
-    return "\n".join(lines)
-# ---- 推論（ストリーミング対応） ----
-def chat(user_input, history):
-    prompt = build_prompt(SYSTEM_PROMPT, history, user_input)
-    inputs = tokenizer(prompt, return_tensors="pt").to(device)
-    # 応答速度重視の設定（CPU前提）
-    gen_kwargs = dict(
-        max_new_tokens=160,       # 初期は短めに。必要ならUIで変更
-        do_sample=True,
-        temperature=0.7,
-        top_p=0.9,
-        repetition_penalty=1.12,
-        pad_token_id=tokenizer.eos_token_id
     )
-    # 逐次出力（Gradioのgeneratorでストリーミング）
-    with torch.no_grad():
-        output_ids = model.generate(**inputs, **gen_kwargs)
-        text = tokenizer.decode(output_ids[0], skip_special_tokens=True)
-    # 一番最後のアシスタントの返答だけを抽出（簡易）
-    reply = text.split("[アシスタント]")[-1].strip()
-    history = history + [(user_input, reply)]
-    return reply, history
-# ---- Gradio UI ----
 with gr.Blocks(theme="soft") as demo:
     gr.Markdown(
-        "# 🧪 遅くて不正確なLLMチャット)\n"
-        "日本語対応"
     )
     with gr.Row():
-        max_tokens = gr.Slider(64, 512, value=160, step=16, label="max_new_tokens", interactive=True)
-        temperature = gr.Slider(0.0, 1.5, value=0.7, step=0.05, label="temperature", interactive=True)
-        top_p = gr.Slider(0.1, 1.0, value=0.9, step=0.05, label="top_p", interactive=True)
-    chatbot = gr.Chatbot(height=420)
-    user = gr.Textbox(placeholder="質問を入力してください（例：生成AIの活用例を3つ）", label="ユーザー入力")
-    send = gr.Button("送信")
-    clear = gr.Button("履歴クリア")
-    state = gr.State([])  # 履歴保持
-    def respond(user_input, history, max_new_tokens, temperature, top_p):
-        # UIの値で生成パラメータを更新
-        global model
-        prompt = build_prompt(SYSTEM_PROMPT, history, user_input)
-        inputs = tokenizer(prompt, return_tensors="pt").to(device)
-        gen_kwargs = dict(
-            max_new_tokens=int(max_new_tokens),
-            do_sample=True,
-            temperature=float(temperature),
-            top_p=float(top_p),
-            repetition_penalty=1.12,
-            pad_token_id=tokenizer.eos_token_id
-        )
-        with torch.no_grad():
-            output_ids = model.generate(**inputs, **gen_kwargs)
-        text = tokenizer.decode(output_ids[0], skip_special_tokens=True)
-        reply = text.split("[アシスタント]")[-1].strip()
-        history = history + [(user_input, reply)]
-        return history, history
-    send.click(respond, [user, state, max_tokens, temperature, top_p], [chatbot, state])
-    user.submit(respond, [user, state, max_tokens, temperature, top_p], [chatbot, state])
-    clear.click(lambda: ([], []), None, [chatbot, state])
 if __name__ == "__main__":
     demo.launch()

 import os
 import torch
+import gradio as gr
+from diffusers import DiffusionPipeline
+# ===== モデル設定 =====
+MODEL_ID = os.environ.get("MODEL_ID", "prompthero/openjourney")
+# 無料CPU前提：float32が安定（bfloat16/float16はCPUだと非推奨）
+torch_dtype = torch.float32
+device = "cpu"  # GPUを使うなら "cuda" に変更（SpacesのHWもGPUへ）
+# パイプラインをロード
+# 注意: from_pretrainedの引数はCPU/FP32に合わせて簡素化
+pipe = DiffusionPipeline.from_pretrained(
+    MODEL_ID,
+    torch_dtype=torch_dtype,
+    safety_checker=None  # 必要なら独自にNSFWフィルタを実装
 )
+pipe = pipe.to(device)
+# 推論関数
+def generate_image(prompt, steps, guidance, seed, width, height):
+    # 乱数シード（再現性）
+    generator = None
+    if seed is not None and seed != "":
+        try:
+            generator = torch.Generator(device=device).manual_seed(int(seed))
+        except Exception:
+            generator = None
+    # CPUではサイズを抑えると速い（例: 512x512）
+    result = pipe(
+        prompt,
+        num_inference_steps=int(steps),
+        guidance_scale=float(guidance),
+        width=int(width),
+        height=int(height),
+        generator=generator
     )
+    image = result.images[0]
+    return image
+# Gradio UI
 with gr.Blocks(theme="soft") as demo:
     gr.Markdown(
+        "# 🎨 OpenJourney 画像生成（CPU/Free）\n"
+        "無料CPUで動作するため、生成には時間がかかります。サイズとステップを小さめにすると速くなります。"
     )
     with gr.Row():
+        prompt = gr.Textbox(
+            label="プロンプト",
+            value="Astronaut in a jungle, cold color palette, muted colors, detailed, 8k"
+        )
+    with gr.Row():
+        steps = gr.Slider(10, 50, value=25, step=1, label="num_inference_steps（多いほど高品質・遅い）")
+        guidance = gr.Slider(1.0, 12.0, value=7.5, step=0.1, label="guidance_scale（プロンプト忠実度）")
+    with gr.Row():
+        width = gr.Dropdown(choices=["384","448","512","576","640"], value="512", label="幅（px）")
+        height = gr.Dropdown(choices=["384","448","512","576","640"], value="512", label="高さ（px）")
+        seed = gr.Textbox(value="", label="seed（空ならランダム）")
+    generate_btn = gr.Button("生成")
+    output = gr.Image(label="出力画像", type="pil")
+    generate_btn.click(
+        fn=generate_image,
+        inputs=[prompt, steps, guidance, seed, width, height],
+        outputs=[output]
+    )
 if __name__ == "__main__":
     demo.launch()

requirements.txt CHANGED Viewed

@@ -1,4 +1,6 @@
 transformers
 accelerate
 gradio
-torch

 transformers
 accelerate
 gradio
+torch
+diffusers==0.31.0
+safetensors