Wikiquote

81 languages, 142 bitexts
total number of files: 126
total number of tokens: 774.1M
total number of sentences: 63.1M

Download

Below you can download data files for all language pairs in different formats and with different kind of annotation (if available). You can click on the various links as explained below.

You need to download the monolingual corpus files and the standoff alignment files between them:

Links on the language IDs of the top row and first column: zip-files of untokenized monolingual XML files
Links on the language IDs of the bottom row and last column: zip-files of tokenized monolingual XML files (if they exist)
Links in the table: Sentence alignment files in XCES Align format (standoff annotation)

	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
af															1.6k																																																af
ang															55																																																ang
ar															22.0k																																																ar
ast															0.3k																																																ast
az															50.3k																																																az
be															1.2k																																																be
bg															0.1M																																																bg
br															1.2k																																																br
bs															46.8k																																																bs
ca															47.3k																																																ca
co															0.2k																																																co
cs															68.2k																																									59.6k							cs
cy															1.7k																																																cy
da															7.1k																																																da
de															71.9k				70.6k																																												de
el															14.5k																																																el
en	0.9M	0.9M	10.6k	0.9M	0.9M	0.9M	0.7M	0.8M	0.9M	0.9M	0.9M	0.9M	0.9M	0.9M		0.9M	0.9M	0.9M	0.9M	0.9M	0.9M	0.9M	0.8M	1.0M	0.8M	0.9M	0.9M	14.9k	0.9M	0.9M	0.9M	0.8M	0.9M	0.9M	0.9M	1.0M	0.9M	0.9M	0.8M	65.9k	0.8M	0.9M	0.9M		0.9M		0.9M	0.8M	0.7M	0.9M	0.9M	1.0M	0.9M	0.9M	0.9M	0.9M	0.9M	0.8M	0.9M	0.8M	0.9M	0.8M	en
eo															6.9k																																																eo
es															0.1M																																																es
et																			14.0k																																												et
eu															6.6k																																																eu
fa															0.1M																																																fa
fi													29.4k		31.2k		28.8k																												28.8k					31.2k													fi
fr															0.1M																																																fr
gl															3.7k																																																gl
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
gu															5.2k																																																gu
hr															28.7k																																																hr
hu															59.0k																																									59.8k							hu
hy															36.5k																																																hy
id															15.9k																																																id
it															0.6M																																																it
ka															2.5k																																																ka
kk															0.1k																																																kk
ko															12.6k																																																ko
lb															15																																																lb
lt															31.9k				31.7k																																												lt
ml															0.7k																																																ml
mr															1.8k																																																mr
nb															10.2k																																																nb
nl															6.7k																																																nl
no															9.5k																																																no
pl															0.7M																																									0.6M							pl
pt															0.1M																																																pt
ro															8.6k																																									9.0k							ro
ru															0.2M				0.2M																																												ru
sa															60																																																sa
sah															3.1k																																																sah
sk																																																								37.1k							sk
sl															16.4k																																																sl
sq															4.5k																																																sq
sr_Cyrl															7.9k																																																sr_Cyrl
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
sv															17.4k				17.4k																																												sv
ta															0.4k																																																ta
te															6.2k																																																te
th															1.3k																																																th
tr															98.6k																																																tr
uk										53.9k		53.6k	52.9k		53.9k											54.7k																57.3k		56.1k		54.5k				56.7k													uk
ur															2.5k																																																ur
uz															0.5k																																																uz
vi															17.2k																																																vi
wo															9																																																wo
zh															56.3k																																																zh
zh_Hans															32.7k																																																zh_Hans
zh_Hant															0.5k																																																zh_Hant
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant

Links to zip-files with aligned plain text files, one per language (Moses format).

	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
af															1.6k																																																af
ang															55																																																ang
ar															22.0k																																																ar
ast															0.3k																																																ast
az															50.3k																																																az
be															1.2k																																																be
bg															0.1M																																																bg
br															1.2k																																																br
bs															46.8k																																																bs
ca															47.3k																																																ca
co															0.2k																																																co
cs															68.2k																																									59.6k							cs
cy															1.7k																																																cy
da															7.1k																																																da
de															71.9k				70.6k																																												de
el															14.5k																																																el
en	0.9M	0.9M	10.6k	0.9M	0.9M	0.9M	0.7M	0.8M	0.9M	0.9M	0.9M	0.9M	0.9M	0.9M		0.9M	0.9M	0.9M	0.9M	0.9M	0.9M	0.9M	0.8M	1.0M	0.8M	0.9M	0.9M	14.9k	0.9M	0.9M	0.9M	0.8M	0.9M	0.9M	0.9M	1.0M	0.9M	0.9M	0.8M	65.9k	0.8M	0.9M	0.9M		0.9M		0.9M	0.8M	0.7M	0.9M	0.9M	1.0M	0.9M	0.9M	0.9M	0.9M	0.9M	0.8M	0.9M	0.8M	0.9M	0.8M	en
eo															6.9k																																																eo
es															0.1M																																																es
et																			14.0k																																												et
eu															6.6k																																																eu
fa															0.1M																																																fa
fi													29.4k		31.2k		28.8k																												28.8k					31.2k													fi
fr															0.1M																																																fr
gl															3.7k																																																gl
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
gu															5.2k																																																gu
hr															28.7k																																																hr
hu															59.0k																																									59.8k							hu
hy															36.5k																																																hy
id															15.9k																																																id
it															0.6M																																																it
ka															2.5k																																																ka
kk															0.1k																																																kk
ko															12.6k																																																ko
lb															15																																																lb
lt															31.9k				31.7k																																												lt
ml															0.7k																																																ml
mr															1.8k																																																mr
nb															10.2k																																																nb
nl															6.7k																																																nl
no															9.5k																																																no
pl															0.7M																																									0.6M							pl
pt															0.1M																																																pt
ro															8.6k																																									9.0k							ro
ru															0.2M				0.2M																																												ru
sa															60																																																sa
sah															3.1k																																																sah
sk																																																								37.1k							sk
sl															16.4k																																																sl
sq															4.5k																																																sq
sr_Cyrl															7.9k																																																sr_Cyrl
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
sv															17.4k				17.4k																																												sv
ta															0.4k																																																ta
te															6.2k																																																te
th															1.3k																																																th
tr															98.6k																																																tr
uk										53.9k		53.6k	52.9k		53.9k											54.7k																57.3k		56.1k		54.5k				56.7k													uk
ur															2.5k																																																ur
uz															0.5k																																																uz
vi															17.2k																																																vi
wo															9																																																wo
zh															56.3k																																																zh
zh_Hans															32.7k																																																zh_Hans
zh_Hant															0.5k																																																zh_Hant
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant

Links to compressed TMX files, one per language pair.

	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
af															0																																																af
ang															0																																																ang
ar															0																																																ar
ast															0																																																ast
az															0																																																az
be															0																																																be
bg															0																																																bg
br															0																																																br
bs															0																																																bs
ca															0																																																ca
co															0																																																co
cs															0																																									0							cs
cy															0																																																cy
da															0																																																da
de															0				0																																												de
el															0																																																el
en	0	0	0	0	0	0	0	0	0	0	0	0	0	0		0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0		0		0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	en
eo															0																																																eo
es															0																																																es
et																			0																																												et
eu															0																																																eu
fa															0																																																fa
fi													0		0		0																												0					0													fi
fr															0																																																fr
gl															0																																																gl
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
gu															0																																																gu
hr															0																																																hr
hu															0																																									0							hu
hy															0																																																hy
id															0																																																id
it															0																																																it
ka															0																																																ka
kk															0																																																kk
ko															0																																																ko
lb															0																																																lb
lt															0				0																																												lt
ml															0																																																ml
mr															0																																																mr
nb															0																																																nb
nl															0																																																nl
no															0																																																no
pl															0																																									0							pl
pt															0																																																pt
ro															0																																									0							ro
ru															0				0																																												ru
sa															0																																																sa
sah															0																																																sah
sk																																																								0							sk
sl															0																																																sl
sq															0																																																sq
sr_Cyrl															0																																																sr_Cyrl
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
sv															0				0																																												sv
ta															0																																																ta
te															0																																																te
th															0																																																th
tr															0																																																tr
uk										0		0	0		0											0																0		0		0				0													uk
ur															0																																																ur
uz															0																																																uz
vi															0																																																vi
wo															0																																																wo
zh															0																																																zh
zh_Hans															0																																																zh_Hans
zh_Hant															0																																																zh_Hant
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant

Wikiquote v1syn

Download

Disclaimer

Notice and take down policy

	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
af															view																																																af
ang															view																																																ang
ar															view																																																ar
ast															view																																																ast
az															view																																																az
be															view																																																be
bg															view																																																bg
br															view																																																br
bs															view																																																bs
ca															view																																																ca
co															view																																																co
cs															view																																									view							cs
cy															view																																																cy
da															view																																																da
de															view				view																																												de
el															view																																																el
en	view	view	view	view	view	view	view	view	view	view	view	view	view	view		view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view		view		view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	view	en
eo															view																																																eo
es															view																																																es
et																			view																																												et
eu															view																																																eu
fa															view																																																fa
fi													view		view		view																												view					view													fi
fr															view																																																fr
gl															view																																																gl
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
gu															view																																																gu
hr															view																																																hr
hu															view																																									view							hu
hy															view																																																hy
id															view																																																id
it															view																																																it
ka															view																																																ka
kk															view																																																kk
ko															view																																																ko
lb															view																																																lb
lt															view				view																																												lt
ml															view																																																ml
mr															view																																																mr
nb															view																																																nb
nl															view																																																nl
no															view																																																no
pl															view																																									view							pl
pt															view																																																pt
ro															view																																									view							ro
ru															view				view																																												ru
sa															view																																																sa
sah															view																																																sah
sk																																																								view							sk
sl															view																																																sl
sq															view																																																sq
sr_Cyrl															view																																																sr_Cyrl
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant
sv															view				view																																												sv
ta															view																																																ta
te															view																																																te
th															view																																																th
tr															view																																																tr
uk										view		view	view		view											view																view		view		view				view													uk
ur															view																																																ur
uz															view																																																uz
vi															view																																																vi
wo															view																																																wo
zh															view																																																zh
zh_Hans															view																																																zh_Hans
zh_Hant															view																																																zh_Hant
	af	ar	az	bg	bn	br	bs	ca	ceb	cs	cy	da	de	el	en	eo	et	eu	fi	fr	fy	ga	gl	he	hr	hu	hy	ia	id	ilo	it	lb	lt	lv	mk	ml	ms	mt	nb	nds	nn	pl	pt	ro	ru	sk	sq	sr_Cyrl	sr_Latn	sv	sw	ta	th	tl	tr	uk	ur	uz	war	zh	zh_Hans	zh_Hant