HF中国镜像站

ds4sd
/

SmolDocling-256M-preview

Image-Text-to-Text

Inference Endpoints

Model card Files Files and versions Community

asnassar commited on 9 days ago

Commit

b742d1c

·

verified ·

1 Parent(s): a344b13

Update README.md

Files changed (1) hide show

README.md +20 -6

README.md CHANGED Viewed

@@ -78,13 +78,27 @@ inputs = processor(text=prompt, images=[image], return_tensors="pt")
 inputs = inputs.to(DEVICE)
 # Generate outputs
-generated_ids = model.generate(**inputs, max_new_tokens=500)
-generated_texts = processor.batch_decode(
-    generated_ids,
-    skip_special_tokens=True,
-)
-print(generated_texts[0])
 ```
 </details>

 inputs = inputs.to(DEVICE)
 # Generate outputs
+generated_ids = model.generate(**inputs, max_new_tokens=8192)
+prompt_length = inputs.input_ids.shape[1]
+trimmed_generated_ids = generated_ids[:, prompt_length:]
+doctags = processor.batch_decode(
+    trimmed_generated_ids,
+    skip_special_tokens=False,
+)[0].lstrip()
+# create a docling document
+doc = DoclingDocument(name="Document")
+# populate it
+doc.load_from_document_tokens([doctags], [image])
+# export as any format
+# HTML
+# print(doc.export_to_html())
+# MD
+# print(doc.export_to_markdown())
 ```
 </details>