構造化テキスト
SGML/XML 系 -------------- DocBook http://www.docbook.org/ SmartDoc http://www.asahi-net.or.jp/ ~dp8t-asm/java/tools/SmartDoc/index_ja.html Simple Outline XML: SOX http://www.langdale.com.au/SOX/ 明示マークアップ系 -------------- Scratch -- A Simple Text Formatting Processor http://scratchml.sourceforge.net/ Textism Tools Textile http://www.textism.com/tools/textile/ >>4 TeX(というかLaTeX?)は明示マークアップ系だと思いますが、 専用スレが存在しているので引き合いに出す程度が無難かなーと思います。 pdf 化の過程で LaTeX に一回落とす処理系は割と多そうなので、ほっといても関連しますので。 とりあえず単発だろ 参照サイトとかを提示すればいいってもんじゃないんだぞ 削除依頼だしてこいな 他力本願ならそれなりに踊ってみせろやといいたい unix のゆの字もはいってねーしな >>7 人が真面目に立てているのに取り合えずで片付けるのは失礼じゃないですか? 単発系のスレでこれだけのリンクをはって単発質問として発言した場合のことを少しでも想像して発言してますか? 脳髄反射な削除発言は自治じゃなくて自治厨だと思います。 >>8 踊れるなら初めから自分で(ry で、板違いだというならどの板に立てればいいのでしょうか。 ソフトでもあるし、UNIX 由来のTeX, roff と一緒に語られることもあるし、Wiki や Blog の記法としてWeb系の板で語られることもあるし。 最終的にUNIX板にしたのはGoogleで各ツール名で検索したら Unix/Linux の2板が多かったからです。 何らかの妥当な根拠を持って他の板に誘導してください。 あれだ、ピロユキにたのんで「構造化板」作ってもらえば、ばっちり。 >>9 そういうのにいちいち反応してたらきりないですよ。 で。 Linux板にDocBookスレがあるけど、いまいち伸びてない。 他にメジャーは構造化テキストとなると TeX くらい? HTMLは「構造」なのか、と言われると微妙だし。 という現状で、総合スレを普通に伸ばそうと思ったら、 1 の方向付けが鍵なのは確か。 専用スレのないフォーマット全般を扱うつもりなのか、 各フォーマットの比較みたいなことをやるのか。 Wiki記法とか、PODやらRDも立派な構造化テキストだろう。 個人的には、smart ascii 系がdiffしたり、cvsしたりするのに便利なので好き。 まぁ、unix板でいいんじゃないの。diffだのcvsだのgrepだのできて 喜ぶ連中がunix板以外にたくさんいるとは思えないし。 Linux板に立てた方がまともに進行するかもな。残念な話だが。 >>6 了解 >>15 あっち見てないのでここの方が嬉しい >>11 > 専用スレのないフォーマット全般を扱うつもりなのか、 > 各フォーマットの比較みたいなことをやるのか。 正直どっちもやりたい(^^; そんなに盛り上がらないだろうから話題を制限してもね。。。 >>12 WORD 等の文書は素材として使おうとするとすげーめんどくさいです。 sed とか awk とか perl とかでプログラマブルに加工できるのはすんげー魅力的です。 >>16 同意です。 明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、 人にはやさしくありません。。。 >>18 > 明示的なマークアップはソフトウェアの処理に向いているのでiff(interchange file format)としては良いのですが、 > 人にはやさしくありません。。。 確かに。 そこでWikiのような簡易記法が出てくるんだろうね。 Wiki のような smart ascii 系も、明示的なマークアップでしょ 読み手としては HTML/XML 系より読みやすいけど、書き手としては至極面倒。 なにより覚えにくい 入りやすさという意味では、HTMLみたいに特殊記号使う方がいいだろうね マークアップしてるかしてないかが明確 >>20 Texinfoなら一応構造化テキストに入ると思うけど。 ネタが無いスレなのでいいんじゃない? >>21 wikiはたしかに方言が多く統一感も無くて混乱するし、HTTPの制限からUIがダメダメで 書きにくいと感じていたけど、howmとかを使い込んで考えがかわったよ。 ていうか、マークアップしてるかしてないか明確なものがhtml/xml/texで、 その点に注目して明示的マークアップ系とsmart ascii系を分類したのじゃないのか。 smart asciiが明示的マークアップと一緒と思うのはどういう点で同一と感じるのさ? >>23 変換後にどうマークアップされるかを思い浮かべると同じだと感じる。 >>24 変換するなら変換後のフォーマットの話であって、それは変換前の フォーマットとは関係ないだろ? >>24 一般的にはそうだね。>>23 の前半でwikiの話をしていたので、>>24 ではそれが 念頭にあった。wikiはHTMLにしかしないから。そう断っておくべきでした。 構文でマークアップするかタグでマークアップするかでしょ。 そんなに違いはないように感じる。 Smart Ascii系と明示マークアップ系だと、書く量と文書の表現力がだいぶ違わないか? 構文にオプションや属性を指定する節なんかを定義する事はできるだろうが、 Smart Ascii系でそういうのってあんまり使われてないよねぇ? =head1 POD perlのB<POD>はどうよ。 =head2 書き易さ Wikiと同じくらい。覚え易さもWikiと同じくらい。 =head2 汎用性 man、html、texinfo、TeXなんかに変換するのは楽だけど YAMLのような汎用性は無い。 =cut テキストファイルとしてメモ帳クラスのアプリでも編集することを前提とした 構造化テキストのフォーマットとしては、Wikiスタイルが今のとこベスト? あー、構造化テキストとは言わないな・・・ すまん忘れてくれ smartdoc 派なオレがきましたよっと。 ttp://www.xmlsmartdoc.org/ メリット . xml なので、多い日も安心 . 数式を書くのが楽(TeX互換) . 日本語OK . tex, html, plain text変換 デメリット . xmlなので、そのままでは読みにくいかも . xmlなので、タグ書き面倒(HTMLと大差ないレベル) . 便利に使い込もうと思うと、java, make(or ant) などの知識必須 . 凝ったPDFを出力しようと思ったら、それなりにTeXの知識がいる TeXに慣れてるひと(書き貯めたスタイルファイルを無駄にしたくないとか、 数式はTeXじゃなきゃ書けないとか)が将来の文書ハンドリングの利便性に 不安を感じたときにオススメ SmartDoc は一時期使ってみたけど、いまいちだった ・閉じタグ必須で入力がHTMLの倍は面倒 ・表現力が低い。パラグラフと箇条書きだけの文書なら使えるかもしれない ・一個の記述が複数のHTML記述に対応するとかの便利さもない ・図のサポートがいまいち。 やっぱり、はじめからLaTeXで書いた方が綺麗だし何より早いと思う ま−でも、こういう自分言語って作る方は楽しいんだろうね 同じくsmartdoc派な俺も来ましたよ。 いままで書く所無かったんだよ。 俺の感想はだいたい>>33-34 と似たようなものだな。 ・レイアウトを凝る必要が無い。 ・テキストが多い。 というのに向いてそう。 思うに、タグ型のフォーマットは、それなりのオーサリングツールに 支援して貰うのが前提な希ガス。 smartdoc 程度ならエディタ補完とxmlタグ閉じプラグインで十分な希モス Docutils ttp://docutils.sourceforge.net/ Purpose The purpose of the Docutils project is to create a set of tools for processing plaintext documentation into useful formats, such as HTML, XML, and LaTeX. Support for the following sources has been implemented: だそうな。 lighttpdのページを見てて発見した。 reStructuredText の機能を含むが、wiki markupやらRFC822な メールファイルにも対応してるそうだ。 Pythonなのが俺的に微妙だけど、ちょっくら試してみる。 >>33 俺は最初からSmarDocファイルで文書のレイアウトをするのはあきらめてるから。 細かいレイアウトをしたい時は生成されたLaTeXファイルを直接編集してdiffをとっとく。 sdoc文書を編集した時も、たいていはpatchで何とかなる。 ...という一連の作業をMakefileで自動化しているので、なかなか快適で離れられない。 まぁデメリットに関しては >>33 の言う通りかと思う。とくにインライン数式が面倒すぎ。 ともかく、sdocにあまり文書のレイアウト情報は入れない方が精神的にも楽。 ttp://www.pault.com/pault/pxml/xmlalternatives.html まだ既出でない SmartASCII がごろごろしているのね(^^; 表現力は低くても、テキストファイルとして自然に読み下せる記法が欲しいな。 Wiki のフォーマットだと、「変換前のファイル」という風味が強すぎるんで。 Markdown が良さそうだけどね。 後はRDとか。 ・・・どっちもテーブルサポートがない奴だな(w 結局メジャーどころのマークアップ言語が一通り挙がったところで終わったな。このスレ。 こんなの情報整理スレでやってりゃ良かったんだよ。 昔akr先生が「構造化文書の記法」なる文書を書いていたのだが、いつのまにか なくなってしまったので参照先はWayback Machine。 http://web.archive.org/web/20041011165213/http ://cvs.m17n.org/~akr/markup ttp://www.pault.com/pault/pxml/xmlalternatives.html ますます、増えてないか。。。 マークアップのデファクトは DocBook な気がするけど、Smart ASCII のデファクトは決まらないのかなあ。。。 OASIS Darwin Information Typing Architecture (DITA) ってどう? 新しいのつくったぜ ttp://www.fiercewinds.net/siki/cgi/?Node=SikiFormat >>59 正直微妙(w あまりにも記号的すぎて自然な感が弱い。 コメントサンクス >自然な感が弱い。 自然な感じだと、reStructuredText使うのが素直でしょうね……アレには敵わん。 ただ、あれだと後戻りが多くてパースするのが大変な気がするけど……どうなのかね? asciidoc が cygwin に入りますた. 軽量ワープロとしてWYSIWYGで編集できるWindows用のツールなんてありませんか? ttp://en.wikipedia.org/wiki/Lightweight_markup_language Lightweight Markup Language という名称は定着するのかな こんなスレあったのね… お手軽メモ書きに使って 打ち合わせ資料とかでそれっぽく変換できる 日本語をそれなりに扱える いまのところ python 関連ということもあって reStructuredText (docutils)使おうと思ってるんですけど 最近イケてるのって何かあるんですかね? reST のさらに wrapper で kagipdf なるものも発見 (↑とりあえず日本語文書を扱うための wrapper みたいなもん?) >>68 構造化テキストで!>< 欲を言うならWinとLinuxでファイルを相互更新できたらいいな そのスレ、内容はともかくグロ画像貼ってあんのはヒドイ これだからマクド使いは、、、 で、現状最有力は結局XMLなの? 早くデファクトスタンダードが決まって欲しい 今更ながら Smart ASCII 系に「xetext」も。 setext-j を微拡張した感じ。とん挫した残骸みたいだけど ttp://www.piedey.co.jp/xetext/ (ページの一番下です) reStructuredText で用語集を作ろうと思ったんだけど、 自動的に<dt>にアンカーをつける方法ってないのかな。 ↓こんな風に書けば望み通りの出力が得られるんだけど、 定義名とアンカーで2回exampleを書くのがいやだ… example_ は例です。 .. _example: example 説明 これだけでリンクが張られてくれるとベスト。 example_ は例です。 example 説明 reStructuredTextは、出力弄るのがちょっと面倒だよな。 xmlで出して変換しろって言うけど、そっちもやっぱり面倒で。 wiki フォーマットで書いて、ツールで見やすい形式のテキストに 変換するのが良いんじゃないかと思えて来た。何と言っても wiki フォーマットは書く為のフォーマットであるというのがグッド。 XML みたいに入力量が増えたりしないし、そのくせ適度に構造化 されているし、インデントが適当でも後で幾らでも整形出来るし、 HTML に変換するのも容易いし、勿論 wiki にもアップ出来る。 特殊なエディタのサポートを必要としないと言うのも良いね。 後は wiki->txt のツールをちょちょっとでっち上げれば完了。 問題があるとすれば、どの wiki フォーマットを使うかかな。 お好きなのドゾー 1. reStructuredText 2. plain2 3. 自分で作る おいらは自作したけどね。RubyでもreStructuredText使えればなぁ。 ruby でもっていうか docutils をsystem()みたく呼べばいいだけってことではないの? さすがにめんどかった。 それに文脈自由文法にも興味あったんで、勉強がてら俺構造化テキストを設計してみました。 まあ、RDがあまりにもアレ過ぎるっつうのもあったんだけどね。 - 見出しの中で最大見出しが一番目立たない記法ってのはおかしいだろ。 - 整形ずみ文書を字下げで表現するのはいかがなものか。エディタの支援必須になっちゃうよね。 - ((●●●))というのが多過ぎ。「見た目の装飾」と「リンク」ぐらいは分けた方が良かったと思う。 とか。 そういえば昔まとめた解説を発掘したんだけど、文法についてコメント頂けますか? ・ここをこうすればLL(1)になるんじゃね? ・これだとこういう組合せで破綻するよ とか教えて貰えると助かります。 ttp://fiercewinds.net/siki/pub/Siki/SikiFormat/ >>82 > 記述や修正に手間のかかることが多いです 俺も RST の問題はここだと思う。 Wiki 書法よりも読み易さを重視した結果だろうけど。 RST って ReST (reStructuredText) のこと? いや、RST は reStructuredText の事だよ RST --> http://docutils.sourceforge.net/rst.html (reStructuredText) REST --> http://ja.wikipedia.org/wiki/REST (Representational State Transfer) >>85 拡張子は3文字信仰が多いから rst だけど、普通 reStructuredText を RST とは言わない. ReST、reSTなどで大文字小文字で判別する. >>86 そんな事どうでも良くない? もしかして何でも決めつけたがりの人? 普通っていうほど普及してるもんでもないし、拡張子の話は誰もしていないし、 公式の URL は rst.html だし、ついでに言えばディレクトリも rst になっているし、 reStructuredText の仕様書中の例題も RST という略号を使用しているし、 Wikipedia でも一番最初に RST と書いてある。だから普通なのはむしろ RST なんだと思うけど、君が ReST や reST と書いても俺は何の文句も言わないよ。 だって、こんな些細な事、普通はどうでも良いからね。 http://docutils.sourceforge.net/docs/ref/rst/restructuredtext.html > |RST|_ is a little annoying to type over and over, especially > when writing about |RST| itself, and spelling out the > bicapitalized word |RST| every time isn't really necessary for > |RST| source readability. > > .. |RST| replace:: reStructuredText > .. _RST: http://docutils.sourceforge.net/rst.html http://ja.wikipedia.org/wiki/ReStructuredText > reStructuredText は RST、reST、ReST と略されることもある。 それよりももっと意味のある話をしようぜ。 どうせ2chなんだから、疑似問題が発生しない程度に判りゃ良いよ。 もともと日本語って読み手・聞き手が文脈から意味を補足するのを前提にしている言語だし。 #述語中心の構成とか そんなことよりも>82の評価 or もっと優れた構造テキストとの比較ヨロ >87=85 が 「4文字で書くな」と決めつけたのが 発端なのに真っ赤になって書くから… というのはさておき ------ 所詮 plain text なんだから章題を「目立たせる」方法ってそんなにないので その辺りはあまり拘っても仕方ない気がする ReST ってガンガン書いて自分なりのルールが決まればいいんだろうけど 第何番目のレベルはどの記号だったっけ? とかがビミョ〜に面倒 (第 n.m.k 節 って書き方を auto-numbering 出来ればちょっと楽かもしれない) あとリストの入れ子について、インデントレベルを気にして書くのも チョイ面倒だったかな(やり方を勘違いしているのかもしれないが) >>89 >「4文字で書くな」と決めつけたのが発端 (・∀・)ニヤニヤ >>85 を見れば明らかに決め付けたがりの人がどっちかは明らかだよな yes といえばいいだけのところでわざわざ RST じゃなきゃと言わんがばかりに主張してるんだから ついでに Google の結果 reStructuredText rest の検索結果 約 98,300 件中 1 - 10 件目 (0.22 秒) reStructuredText rst の検索結果 約 74,400 件中 1 - 10 件目 (0.27 秒) reST が当たり前だというほどではないけど、rst の方が少数派なのは確かっぽい おまいら省略形禁止。reStructuredTextて書け。 >所詮 plain text なんだから章題を「目立たせる」方法ってそんなにないので reStructuredTextは目立っていると思うよ。 #とか$とかの字面の黒い文字使ってさらに強調する手もあるけど、あれで十分じゃない? ただ、指摘の通りアシストツールがないと結局書けなくなるよな。 参考書片手でもいいけど、そうなるとお手軽さが無くなるし…… そういや全然別の話だけど、reStructuredTextて文脈自由文法に納まっていたっけ? >>91-92 > 明らかに決め付けたがりの人がどっちかは明らか そんなに真っ赤になって書かなくても良いよ もう諦めたら? >>92 ついでに rest は使用頻度の高い一般名詞でもある Google の検索結果を鵜呑みにせず、そういう所にも気を使おう 過疎ってるなー reStructuredTextのラッパ(?)でsphinxというのが出てきたそうな。 http://sphinx.pocoo.org/ python2.6のドキュメント↓もsphinxを使ってるんだと。 http://docs.python.org/dev/ reStructuredTextからのpdf生成がもっと簡単に(latexに頼らずに) できるようになったら、自分で文書書くときはwordと決別できそう なんだけど… reStructuredTextよりもasciidocの方が良い気がしてきたぞ… 最初から数式が使えるし、次のバージョンでは 要求仕様/設計結果対照表みたいな左右に並べるテーブルを 簡単に記述できるようになるみたいだし。 どっちもpythonで書かれているし、いっそのこと統合して欲しいもんじゃ。 asciidocってreStructuredTextなんだと思ってた・・・ ニホンゴ(EUC? UTF8?)は使えるんでしょうか? infoみたいにemacsから容易に利用できかつ画像とか埋め込めるフォーマットねぇかなぁ pdfはいまいち使いにくいんだよね pandoc 使え pandoc html, markdown, reStructuredText あたりを読み込んで、 html, markdown, reStructuredText, pdf, LaTeX, DocBook XML その他 もろもろに変換できる、スグレもの。 ttp://johnmaxfarlane.net/pandoc/ ニホンゴは? utf8 で処理するって書いてあるけど pdf とか latex とかはどうなるの? 俺はこの組み合わせ asciidoc(原稿)+XSLT(デザイン) このスレ読んでpandocが気になった。 また古いスレ上がってんな。smartdocとか懐かしいな。流石にもう誰も使ってねーよなw >107 すまんな、Asciidocに絡む案件があったのでageたくなったんだ htmlファイルを読み込んで、構造を表示してくれるようなアウトラインプロセッサが欲しい… asciidocベースで個人サイト構築作業してるけど、Pandoc使いたくなってきてしょうがない。 というかもう設定ファイル見飽きた…高機能だけど無駄にHTML汚いし…そもそもちゃんとXMLパースしろよ… ずいぶん過疎っていますがrst2pdfの話題とかもここでいいのでしょうか? 好きな話を好きなだけすればいい ネタが全くない状態だし >大阪府三島郡島本町の小学校や中学校は、暴力イジメ学校や。 島本町の学校でいじめ・暴力・脅迫・恐喝などを受け続けて廃人同様になってしもうた僕が言うんやから、 まちがいないで。僕のほかにも、イジメが原因で精神病になったりひきこもりになったりした子が何人もおる。 教師も校長も、暴力やいじめがあっても見て見ぬフリ。イジメに加担する教師すらおった。 誰かがイジメを苦にして自殺しても、「本校にイジメはなかった」と言うて逃げるんやろうなあ。 島本町の学校の関係者は、僕を捜し出して口封じをするな >島本町って町は、暴力といじめの町なんだな 子供の時に受けた酷いイジメの体験は、一生癒えない後遺症になるなあ AsciiDoc の発想はいいんだけどコンパイラが準拠してる TeX や HTML の仕様が古すぎて気持ち悪い 誰でも簡単にパソコン1台で稼げる方法など 参考までに、 ⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。 グーグル検索⇒『宮本のゴウリエセレレ』 ULIDTQ9K49 知り合いから教えてもらったパソコン一台でお金持ちになれるやり方 時間がある方はみてもいいかもしれません グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』 TCJKI 15年経って Markdown がデファクトスタンダードを獲得したということでFAか read.cgi ver 08.0u [upliftProject] - 2023/07/09 Walang Kapalit ★ | uplift ★ 5ちゃんねる